2017-08-21 7 views
0

長時間実行されているhadoopジョブ(Hive/Map Reduce、spark)を監視する必要がある、クラスタで3時間の持続時間。私はこれらのジョブをすべてUIで見ることができますが、毎時間または30分ごとにそれを監視し、ジョブが3時間以上実行されている場合は電子メール/アラートを送信する必要があります。これを行う方法はありますか? 私の環境では、事前にHadoopで長時間実行されているジョブの監視、送信方法

おかげHDP 2.6です....

答えて

0

言及 - oozieは、Hadoopのの文脈でこれを行うには "正しい" 方法です。

ただし、すべてのオーバーヘッドを必要としない場合は、オンデマンドウォッチドッグタイマーのような単純なもので十分です(つまり、wdt.io)。基本的に、ワークフローは開始信号を送信し、ジョブを開始し、ジョブが完了すると終了信号を送信します。第2の信号が、割り当てられた時間内に入ってこない場合、電子メール/ SMS警告が送出される。

この方法は、非ハープープワークフローでも機能します。

関連する問題