2016-08-30 5 views
6

私は最新のsensuコアバージョン0.26.1を使用しています。Sensus Serverを1台のCentOSマシンにセットアップし、もう1台のSensuクライアントを別のCentOSマシンにセットアップします。センスクライアントのエラー「前のチェックコマンドの実行中」

sensuクライアントでは約500個のチェックがありますが、sensu-client.logには"previous check command execution in progress"が表示されますが、実際には非常に高速です(ほとんど0.1秒未満、間隔は60秒です)。 sensuユーザーsudo su sensu -c "{run my check}"の下で実行して確認してください。

しかし、実際の状況となった、うちわのダッシュボードには、それは私のチェックの多くが1分以上を実行していた示し、私は以下のアプローチを試してみました、sensuのクライアントが遅い/真剣に捕まってしまったようです

  1. 10に、私のチェックに制限タイムアウトをtimeout定義を追加
  2. をいくつかの長時間実行のチェックを外し、sensuのサーバ/クライアントを再起動し、その後、小切手の多くが生じを「実行がタイムアウトになりました」。
  3. 1、10、50の小切手を試してみましたが、すべてが正常に機能していたようですが、小切手の数が200-300に達すると問題が発生しました。

上記のどちらの作業も、どのチェックが実際にブロックされているかをデバッグする方法はありますか?または、timeoutの定義を超えたときにチェックを殺すようにsensuを設定することはできますか?私はこれによってブロックされてしまった

ログ「進行中の前のチェックコマンドの実行」でこのメッセージが表示され、これをデバッグするには:)

答えて

1

を助ける必要はありませんように、あなたは明らかにsensuの-client.logを確認することができます。 ps aux | grep sensuは、すべての小切手が別のプロセスとして表示され、どの小切手がハングアップしているのかを簡単に確認することができます。ps aux | grep sensuでは、sensuのデフォルトファイルにログレベルを設定できます。ps aux | grep sensu ここでの通常の問題は、小切手に傷をつけて、感覚クライアント自体を吊るすよりも吊り下げることです。

私はいくつかの小切手で自分自身を経験しました。

少なくとも、ログの出力と[問題が発生したときの] psコマンドが必要になります。

関連する問題