EC2は、分散可能な(並列化可能な)プロセスを実行するための非常に便利でオンデマンドのスケーラブルなメカニズムを提供し、S3は信頼性の高いストレージサービスを提供します。高速で信頼性の高いS3からEC2接続を確立する方法
私はETL &分析プロセスにEC2ノードを採用しようとしていましたが、このプロセスでは大量のデータ(100GB〜1TB)が非常に迅速に(1日数回)摂取され、短い期間。
上記設計は
- S3とEC2との間の高帯域/高速接続を必要とします。
- コストを節約するだけでなく、SLAが関与しているため、できるだけ早く開始、ポンピングインデータ、実行プロセスおよび終了ノードのスケジューリングを行う必要があるため、S3 - > EC2接続も信頼性が高くなければなりません。
しかしはまだ
- S3からデータを引っ張っする唯一の手段は、http経由であると思われるので、それがEC2のノードのダウンロード帯域幅によって制約されます。
- また、データの摂取はインターネットを経由するため、厳密なスケジューリングの目的では十分に信頼性が低く、ジョブ間で適切なバッファリングが必要になる可能性があります。
プライベートデータセンターの設定では、ストレージノードと物理ノードの間の専用線をより高速に設定できます(例:10Gbps)。
上記の要件を満たすことができるawsの場合、可能な代替/サービスオプションはありますか?
アマゾンhaventはそのウェブサイト上でこのことについては何も発表され、取得する任意の他のソースがありますこの情報には、柔軟な転送速度の選択を可能にする異なる価格モデルがありますか。 – sandeepkunkunuru
**それは**変化するので、そのような情報はありません。AWSのネットワーク速度を向上させる唯一の方法は、サーバ間で10ギガビットの接続を持つクラスタインスタンスを使用する方法と、AWSの高価な専用インスタンス(http://aws.amazon.com/dedicated-instances/)を使用してエフェクトを制御する方法ですあなたのサーバー上の他の人の – ceejayoz