2012-04-29 10 views
0

ヘッドノードがマスターであり、他の7つのノードがスレーブとして構成されているHadoopクラスタを持っています。スレーブはそれぞれ8コアと8 GBのメモリを備えています。私は、 "mapred.tasktracker.map.tasks.maximum"パラメータとスレーブ設定ファイルのスレーブ数を変えて遊んでいます。私のプログラムが40個のタスクを実行しなければならない場合、いくつかのログファイルやどこかの個々のスレーブノードで実行されたタスクの数を確認できますか?基本的に、私は異なるノード間でマップタスクの配布を探しています。hadoopでは、各スレーブノードで個別に実行されているマップタスクの数を確認する方法は?

答えて

1

これを行う最も簡単な方法は、Hadoopシステムに付属のWebインターフェイスからのものです。

あなたのウェブブラウザ、内タイプの例:50030:jobtrack-マシンのホスト名はlocalhost:50030

そして、あなたはあなたが欲しいものを得るでしょう。

1

Gangliaをインストールして、jobtrackerから統計を監視できます。私は自分のクラスターでこれをやったので、インストールはとても簡単でした。また、各ノードの負荷、スワップ、ディスク、メモリ使用量などを監視することもできます。 http://wiki.apache.org/hadoop/GangliaMetrics

落とし穴ALERT:

はこちらの手順を参照してくださいあなたは神経節をインストールしている場合は、おそらくあなたの代わりに、彼らはそのページに持っているものの org.apache.hadoop.metrics.ganglia.GangliaContext31を使用していることを確認したバージョン3.1を取得するつもりです。

関連する問題