2013-03-01 17 views
6

私はDynamoDBを初めて使用しています。このキー/値ペアのデータストアからDBMSよりもレポートの生成に違いがあるのだろうかと思います。Dynamodbからのレポートの生成

My(Java)アプリケーションはDynamoDBにデータを書き込みますが、私はそこからビジネスレポート(セールスレポートなど)を生成したいと考えています。

AmazonはEMR(elastic Map Reduce)を提供していると理解しています。さらに、Hiveの下にSQLのような構文を使用してDynamoDBを照会することができます。

データが50GB未満である必要がありますが、EMRを使用してこのタスクを実行していますか?

答えて

7

はいハイブはSQLのような構文を使用します。ハイブはまだJavaで書かれており、それはまだJavaです。 Hive wikiはstart.Hereに良い場所は、EMRにこのタスクのやり過ぎを使用している私のデータが50ギガバイト未満でなければならないhttp://aws.amazon.com/articles/28549

EMR とダイナモDBを使用する方法について良い記事ですか?

EMRセットアップがあり、dynamoテーブルをs3または内部のhadoopテーブルにエクスポートすると、私はそうは思わないでしょう。次に、DynamoDBの暫定スループット能力に影響を与えずに、S3または内部hadoopテーブルをクエリできます。 S3は非常に高速であるため、複雑なハイブクエリを作成して、必要なレポートを作成することができます。

The command line tool EMRのセットアップは非常に簡単です。お金を節約したい場合は、いつでもスポットインスタンスに入札できます。

また、ジョブが低速で実行されている場合は、コアノードとタスクノードを増やして、必要に応じてジョブをすばやく実行できます。

関連する問題