2017-02-14 1 views
0

私は次のセットアップがあります。サイトがダウンしているとき、私はセットアップAのStackdriver HTTPS稼働時間のアラートが通知することができますが、すべてのn個のポッドは、アクションの外にあるときに、これが唯一の警告が表示されますK8ポッドがダウンしたときに警告するスタックドライバのアラートを作成することはできますか?

K8 Ingress --> K8 Service --> K8 Pods x n 
(GCP LB for SSL)  (NodePort)  (containing the application) 

を。

n個のアプリケーションポッドのいずれかが停止しているときに警告するスタックドライバアラートを作成することはできますか?

答えて

0

第1に、n個のアプリケーションポッドがダウンしているときに警告する必要性を完全に排除できるように、正しいスケーリングを行うことを検討する必要があります。さらに、基盤となるインフラストラクチャではなく、ユーザーがどのような症状を経験するか(遅延やエラーが増加する)を警告するのが最善です。 n個のポッドが一時的にダウンしても、ユーザーの要求が引き続き提供される限り、大丈夫かもしれません。 GKEで実行している場合は、コンテナの稼働時間を警告できます。あなたの質問から私はそれが当てはまらないと仮定しているので、次のいずれかを行うことができます。 *独自の稼働時間チェックをログに記録し、ログのメトリックを作成し、特定のしきい値を下回ったときに警告します。 *同様に、カスタムのアップタイムメトリックを作成し、警告します。 カスタムメトリックを作成せず、メトリックの欠如をアラートポリシーの条件として使用することは避けたいので、オプションとしてリストしませんでした。HTHとStackdriverを使用していただきありがとうございます。

+0

ありがとうございます - 私はセットアップを明確にしましょう:私はスケーリングが処理されるように、K8の配置でGKEで実行しています。 K8ポッドのヘルスチェックに潜んでいたバグがあったため、しばらくするとポッドが起動しなくなるという問題がありました。これは、時間がたつにつれ(数日間にわたって)、私はポッドを失い、CrashLoopBackoffで終わることを意味しました。私はすべてのnが失敗したときにだけ警告を発するだろう。 K8デプロイメントで#available <#desiredが使用されているときに警告を出すとよいでしょう。 – user2515975

関連する問題