1
私は、2次ソートがHadoopでどのように動作するかを理解しています。私は4つのフィールドで構成される中間キーを作成しました。私は最初のフィールドで分割し、1番目と2番目にグループ化し、すべてでソートします。Hadoop MapReduceジョブでセカンダリソートの問題をデバッグする際のヒントを教えてください。
グルーピングとパーティション分割を釘付けにしているようですが、値は減速器に順不同です。
これをデバッグする方法についてのアイデアはありますか?
私は自分の答えを受け入れています。 – Olaf