2012-02-10 10 views
1

私は、2次ソートがHadoopでどのように動作するかを理解しています。私は4つのフィールドで構成される中間キーを作成しました。私は最初のフィールドで分割し、1番目と2番目にグループ化し、すべてでソートします。Hadoop MapReduceジョブでセカンダリソートの問題をデバッグする際のヒントを教えてください。

グルーピングとパーティション分割を釘付けにしているようですが、値は減速器に順不同です。

これをデバッグする方法についてのアイデアはありますか?

答えて

0

現時点では、手動またはツールを使用して静的コードのレビューがうまくいくようです。 compareTo()を無効にするときは、equals()hashCode()を上書きすることを忘れないでください。これを修正して問題を解決すれば、私は誰もが投稿し続けるでしょう。

+0

私は自分の答えを受け入れています。 – Olaf

関連する問題