Stackdriverを使用してGKEクラスタで動作するポッドのステータスと再起動回数を監視する方法はありますか?Google Container Engine(GKE)とStackdriverを使用してポッド状態を監視して警告するか
StackdriverのすべてのポッドのCPU、メモリ、およびディスク使用率のメトリックがわかりますが、クラッシュのために再起動されているレプリカセットのポッドやポッドがクラッシュするというメトリクスを得る方法がないようです。
私はKubernetesレプリカセットを使用してポッドを管理しています。したがって、クラッシュ時に再作成され、新しい名前で作成されます。私がStackdriverのメトリックを表示することができるのは、実際には賢明に聞こえないポッド名(ポッドの生涯には一意)です。
ポッドの故障時に警告するのは、現時点ではこれがサポートされていないと考えるのが難しいような自然なことです。私がStackedriverからGoogle Container Engineのために取得したモニタリング機能と警告機能は、寿命が非常に短いポッドに縛られているので、むしろ役に立たないようです。
これで解決しない場合は、連続的にクラッシュするポッドを監視する方法に関する既知の回避策またはベストプラクティスがありますか?
を再起動すれば、私は同様のソリューションにも同様に働いている知っているkube_pod_container_status_restartsを使用することができます展開..私はいくつかの更新がある場合は、私はあなたに知らせる! –