2008-09-17 8 views
9

アプリケーション保健監視システムは、あなた(開発者)および/または上司(ITマネージャ)および/またはオペレーション(オンコール)スタッフにとって最低限必要なことは何ですか?アプリケーション健全性監視システムの要件は何ですか?

これ以外に必要なものは何ですか?

インフラストラクチャアプリケーション(ms-exchange、apacheなど)を十分に監視しているか、個々のユーザーアプリケーション、Webサイト、およびデータベースも監視する必要がありますか。

後者の場合、それらについて知る必要はありますか?

補遺:入力用のおかげで、私は本当に、アプリケーションレベルの監視インフラストラクチャではないモニタリングを探していましたが、

+0

はい、これは自己解決型の質問です。だから何? –

+0

これは、正確にあなたが監視しようとしているものは、ディスクリプションのための漠然としているようですか? –

+0

これは私にあなたに教えてもらいたいことです... –

答えて

11
  • アプリケーションが実行中であるかどうか。
  • 珍しいCPU /メモリー/ネットワークの使用。
  • 未処理の例外を報告します。
  • さまざまなモジュールのステータス(該当する場合)。
  • 外部コンポーネント(データベース、Webサービス、ファイルサーバーなど)のステータス
  • (該当する場合)保留中のバックグラウンドタスクの数。
  • アプリケーションの使用状況を追跡し、使用頻度の高い機能や使用していない機能に関する統計を報告することがあります。そのため、最適化が最も効果的な場所を知ることができます。
+0

どのように "珍しい"と定義していますか? –

+0

それはアプリケーションに依存しますが、基本的には特定の期間(例えば5分)にわたって平均使用率を得て、X(90%cpu、1ギガヘルツ、200kbps)よりも高い場合、アプリで)、報告してください。 –

1

最小の両方を知って良いです:それは実行されていることを確認してください:)

しかし、他のものは非常に便利です。たとえば、CPU負荷、RAM使用量、および(マルチユーザーシステムでは)ユーザーが何を実行しているかなどです。また、ネットワークにアクセスするアプリケーションの場合、各アプリのネットワーク接続のリスト。そして、(あなたがクライアントコンピュータにアクセスできない場合)、アプリの「ウィンドウのタイトル」を見ることができれば涼しいでしょう。また、アプリケーションで開いたファイルのリストは非常に便利ですが、必須ではありません。

+0

Apache、Exchangeなどの一般的なサービスを監視するには、すべての仕事を既に行っているNagios(オープンソース)のようなソフトウェアを見てください。インストール、設定、お楽しみください。 –

2

答えは「それに依存する」です。なぜあなたは監視する必要がありますか?運用スタッフはどれくらいですか?報告が必要ですか?アプリケーション環境とは何ですか?アプリケーションが失敗した場合、誰が気にしますか?例外が発生した場合は誰が気にしますか?いずれかのエラーは回復可能ですか?私は長い間これらのような質問をすることができました。

+0

続行してください... –

+0

[@David Medinets]:「なぜ監視する必要があるのですか?」という答えは、サポートについて積極的に行動することです。つまり、何かがすぐにうまくいかないときを知り、修理できるようにします。 –

1

これはかなり簡単だと思います。何か問題が起こる前に十分早めに警告することができます。これは、モニターの依存関係とアプリケーション自体を意味します。

監視しているアプリケーションの詳細を提示しない場合は具体的な記述が難しいので、一般的なルールとして使用してみましょう。

+0

私のプロジェクトは.NETアプリケーションを監視するためのシステムです - すべてのタイプの –

2

これはオープンエンドの質問ですが、私は物理的測定から始めます。
1.このサイトをホストしているすべてのマシンがping可能ですか?
2.コンテンツを提供する必要があるすべてのマシンが、何らかのコンテンツを提供していますか。
3.各マシンで期待されるサービスがそれぞれ実行されていますか
3aこれらのサービスは最近実行されていますか?
4。各マシンにはハードドライブスペースが残っていますか? (dbを忘れないでください)
5.これらのマシンをバックアップしましたか?最後はいつですか?

システムの物理的な監視を設定したら、システム固有のものに対処できますか?

1.自動ログインできるのですか?どれくらいかかりましたか?
2.ライブには何人のユーザーがいますか? 100万の偽のアカウントが追加されましたか?
...
これらの種類の質問は、より曖昧になり、非常にシステム固有のものになります。それらはまた、通常、脈測定に応答する際に反応的に導出することができる。ハードドライブがいっぱいになると、エージェントの束があまりにも多くの偽のユーザーを作成したため、Webサーバーのログがいっぱいになった可能性があります。そんなこと。

プランAは、必ずしもリアクティブである必要はありませんが、多くのサイトが監視システムを設定する方法です。

+0

優れた点ですが、各マシンで実行されているアプリケーションはどうですか? –

1

少なくとも、システムが正常であることを知りたい場合。これはあなたのシステムが健康であることを定義する点で主観的です。それはコンピュータが稼働しているか、必要なリソースが存在しているか、データがシステムを流れるか、データが適切に結果などを生成しているかなどです。実際には、すべてが機能していることを分析するために使用できる最も高いレベルにまで下がります。我々の場合、データ出力まで知る必要があります。これらのマシンがアップされていることを知る必要があるだけであれば、経験の浅いエンドユーザに何が間違っているかを表示しようとする手間を省くことができます。

データの検索結果が非常に重視されている場合は、多くの面倒な作業を行う「オフシェルフ」ツールもあります。私は周りを見回していたときに特にNagiosが好きでしたが、私たちはそれが簡単に見える以上のものを必要としていたので私自身のモニタリングシステムを書きました。基本的には、システム内の「特異性」、メモリ/ CPUスパイクなども監視します。

+0

nagiosは他の多くと同様に、個々のアプリケーションではなく、インフラストラクチャアプリケーションのみを監視します。あなたのユーザーのプログラムが「健康的」であることを確認するためには、何が必要ですか? –

1

皆さん、ありがとうございました。私は実際にインフラストラクチャの監視ではなくアプリケーションレベルの監視をお探しでしたが、

両方について違いがある:

  • インフラストラクチャの監視、サーバに加えてMS Exchange Serverのは、Apache、IIS、および等々
  • アプリケーション監視は、ユーザーのマシンとそれらが使う特定のプログラムになるだろう彼らの仕事、そして/またはサーバーとデータ移動/データの流れを維持するために実行するバックエンドアプリケーション

時には線を描くのが難しい場合があります。単純すぎる定義は、「あなたのチームがそれを書いた場合、アプリケーションです。あなたはそれを購入した場合、それは「インフラだ

私は実際に、それはあなたがする必要がどのような両方の

1

は、アプリケーションのビジネス・プロセスを分解して、主要でイベントを発するソフトウェアを持つことである監視することが最善だと思いますさらに、エンド・ツー・エンドの合成トランザクション(エンド・ユーザーがWebサイトをクリックすることをエミュレートするなど)を作成する必要があります。そのアプリケーションがTivoli MonitoringのJMXアダプターに流入した後、「偽のユーザー」を実装したスクリプトを実行して結果のパイプをTivoli Monitoringのスクリプト・アダプターにパイプします。生データ。

+0

興味深い - しかし、私は結果をシミュレートしようとしていない、私はリアルタイムで実際の結果を監視しようとしている –

+0

監視はリアルタイムです...エミュレーションの部分は、ダッシュボード。 –

2

大きな質問です。

私たちはしばらく前に、私たちのニーズに合ったアプリケーションレベルの監視ソリューションを探していました。一般的な監視ソリューションは、ほとんどが監視インフラストラクチャに向けられており、私の意見では、ほとんどの中小企業の要件には複雑すぎます。

我々は(主に)次の機能が必要: - 私たちは可能な限り高速
  • 無痛管理などについて 事件を知りたいと思った -

    • アラートのホスティングサービスは、 最高
    • 視覚化wouldbe - それは良いことです何が起きているかを知り、データから知識を得るために

    私たちは適切なsoluti私たちは自分自身を書くようになりました。最後に、AlertGridと呼ばれる実行中のサービスで終了しました。 (もちろん無料で確認できます)

    これは、カスタム監視シナリオを簡単に処理できるようにすることです。インテグレーションAPIは非常に単純です(2つの必須パラメーターを持つ関数の1つ)。

    • モニタースケジュールされたタスク(cronジョブ)我々はまた、例に取り組んでいる
    • アプリケーションのエラーに
    • モニター全体のアプリケーションロジックの実行
    • 警告:mommentで我々と他の人がそれを使用していますAlertGridを使用した基本インフラストラクチャの監視
  • 関連する問題