0
還元剤が一時フォルダからコピーしようとすると、中間データ(Mapperによって放出される)の複製が行われますか?Hadoopのレデューサーレベルで複製しますか?
還元剤が一時フォルダからコピーしようとすると、中間データ(Mapperによって放出される)の複製が行われますか?Hadoopのレデューサーレベルで複製しますか?
いいえ、マッパーによって発行されたデータは、マッパーマシンのローカルディスク上に存在します。減速機はネットワークを介してそれをコピーします。マッパーノードがコピー中にダウンした場合、またはコピーが開始される前に、新しいマッパータスクが他のノードに生成されます。
データをhdfsに書き込むときに減速するかどうかを確認しますか?/ – codecian
レデューサがデータを出力すると、データはHDFSに格納され、レプリカノードの1つはレデューサノード自体(またはレデューサに最も近いノード)になります。これにより、いくらかのネットワーク帯域幅が節約されます。 –