2016-08-04 9 views
-1

最近Claudera HadoopとHDFSで、私たちのNameNodeサービスを開始できなかった面白いシナリオがありました。Hadoop JvmPauseMonitor

HDFSサービスの再起動時に、私たちのクラスタでNameNodeサービスを正常に再起動できませんでした。ログの見直しの際に、我々はすべてのエラーを観察したがJvmPauseMonitorに関連するいくつかのエントリを参照してくださいましたしませんでした...

org.apache.hadoop.util.JvmPauseMonitor:検出JVMで一時停止またはホスト・マシン(例えばGC ):約5015ms

我々は/var/log/hadoop-hdfs/NAMENODE.log.outでこれらのエントリを観察し、/var/log/messagesを含む任意の他のエラーを見ていなかったの一時停止。

答えて

1

YOUR JavaヒープSIZESをCHECK最終的に、我々はログに記録されていなかったのJava OOM例外に実行していたことを確認することができました。

HDFSの100万ブロックごとのパフォーマンスの観点からは、少なくとも1GBのJavaヒープサイズを設定する必要があります。

この例では、NameNodeとSecondary NameNode ServicesのJavaヒープサイズを増やして再起動したのと同じくらい簡単でした.150万ブロックに成長しましたが、Javaのデフォルトの1GB設定ヒープサイズ。

Javaヒープサイズを少なくとも2GBに増やし、HDFSサービスを再起動した後、私たちは全面的に緑色でした。

乾杯!