2017-08-18 3 views
0

2つのマスターノードを持つAmazon EMRクラスタでスケーラブルなNutchクローラを設定しようとしています。私のシードURLリストは10000のURLだけですが、私のクローラはMap-reduceジョブのフェッチフェーズで約90%で立ち往生します。それは5000のURLのためにうまくいった。私が紛失している構成はありますか?Nutchクローラが大きなURLに対してスケーリングしない

+0

あなたのエラーログを共有してください! –

答えて

0

MapReduce UIに移動し、フェッチフェーズのログを確認します。おそらく何がうまくいかなかったのかというヒントを含んでいます。

関連する問題