私は、クラウド(MongoLabまたはMongoHQ)でホストされている大きなMongoデータベース(100GB)を持っています。私はいくつかの高価な統計を計算するためにいくつかのMap/Reduceタスクをデータ上で実行したいと考えており、これを達成するための最良のワークフローが何であるか疑問に思っていました。理想的には、AmazonのMap/Reduceサービスを使用して、独自のHadoopクラスタを維持するのではなく、これを実行したいと考えています。MongoからのデータにMap/Reduceを実行する最良の方法は何ですか?
データベースからS3にデータをコピーすることは意味がありますか。次にAmazon Maps/Reduceを実行しますか?または、これを行うためのより良い方法があります。
また、私は頻繁に毎日のようにクエリを実行したいので、S3のデータはMongoのものを反映する必要があります。
どのような示唆/戦争物語が非常に役に立つでしょう。