2016-09-28 5 views
0

AWSで多数のEC2インスタンスを実行する大規模なWebベースのアプリケーションを使用しています。ときには週に2〜3回程度 - 私のインスタンスの1つが100%CPUに達したことを通知する私のSensu監視システムからのアラーム通知を受け取ります。AWS EC2のCPU使用率がIOWaitから瞬間的に100%になるのはなぜですか?

これは通知です:

CheckCPU TOTAL WARNING: total=100.0 user=0.0 nice=0.0 system=0.0 idle=25.0 iowait=100.0 irq=0.0 softirq=0.0 steal=0.0 guest=0.0 

Host: my_host_name 
Timestamp: 2016-09-28 13:38:57 +0000 
Address: XX.XX.XX.XX 
Check Name: check-cpu-usage 
Command: /etc/sensu/plugins/check-cpu.rb -w 70 -c 90 
Status: 1 
Occurrences: 1 

これは瞬間的な発生のようですし、CPUはバックダウン秒以内に正常レベルに戻ります。だからそれはあまり心配しない何かのように思えます。しかし、私はまだそれが起こっているのは不思議です。 CPUが100%IOWaitsで占められていることに注意してください。

FYI、Amazonの監視システムはこのブリップに気付かない。 13:38

enter image description here

enter image description here

enter image description here

でCPU & IOlevelsを示す以下の画像を参照してください興味深いことに、AWSは、このインスタンスはすぐに引退するだろうと言われますと言います。両者は関連しているかもしれませんか?

enter image description here

答えて

0

AWSはわずか5分の期間を表示している、とあなたのCPUのチェックは、単一の発生後にアラームを送信するように設定されているように見えます。 CPUチェックの間隔が5分未満の場合、AWSコンソールは実際のCPUスパイクをマスクするために平均をロールアップしている可能性があります。

スパイクが表示されているかどうかを確認するには、AWS監視コンソールの期間を狭くすることをおすすめします。

0

私はこれをコメントとして追加しますが、私はそのように評判はありません。

私は私のEC2インスタンスがこれをやっているに気づいたが、はるかに長いとapt-getの更新が+アップグレード後のためにしています。 私はそれを厳しいが、その後テストするために、新しいインスタンスでnginxのを使い始め、Apacheのものだった、とそれだけでそれをやった、数時間前にapt-getを実行し、その後、完全なCPUを使用してインスタンスを見つけるために戻ってきた - 時間!それはちょうどテストマシンですが、ubuntu/apt-getに何が間違っているのだろうか?これからは、正常に戻す唯一の方法だと思われるので、apt-getの後にマシンを再起動しなければならないと思います。

関連する問題