もし私がMongo DBの100万レコードを持っていて、各レコードが5KBあれば。このデータに対してMap-Reduceを実行し、このアプリケーションに必要なRAMを見積もりたいとします。 map-reduce操作中に、このDBの読み書きは行われません。 map-reduceはいくつかのレコードを集約し、集約されたレコードの論理比較を行います。ワーキングセットを計算する手順は何ですか?
map-reduceがデータをRAMに持ち込む方法を理解したいので、ワーキングセットをどのように計算する必要があるかを理解したいと思います(例:1MM x 5Kbが自分の作業セットとなるはずです)。