私はMapreduceの学習を始め、いくつかの質問をしたいと思います。ここに行く:InputSplits in mapreduce
ケース1:入力形式としてFileInputFormat。処理されるべき複数のファイルを有するディレクトリは、入力パスである。 n個のファイルがある場合、hadoopクラスタ内のブロックサイズより小さいファイルすべてマップの分割数は、ジョブを減らすために計算されますか?
2)MyFileInputFormatというクラスでFileInputFormatを拡張し、isSplitableをオーバーライドして常にfalseを返すようにします。入力設定は上記と同じです。 この場合、n個の分割が得られますか?
3)n個のファイルの中の1つのファイルがクラスタのブロックサイズよりわずかに大きい場合、2番目のケースではn + 1個の分割が得られますか?
ありがとうございました!
ありがとうGautam。 3番目のケースでは、isSplitableがtrueを返すと、次にN個の分割がありますか? – user1808266
ありがとうのトークンとしてupvoteしてください。 ケース1:N ケース2:N ケース3:N +1 – KrazyGautam
こんにちはGautam。私はあなたの答えをupvoted、しかし私は2の評判を持っているように表示されません:(しかし、私は真剣に感謝しています。 – user1808266