2012-03-12 5 views
3

にアクセスログを解析し、成功したすべての試行を記録するように割り当てられました。 Apache Webサーバーのアクセスログを調べる際に、いくつかの例がありました。形式が間違っていた約3/100,000のログです。ログは、たとえば、96.45.3.2 - - [14/Mar/2011:00:12:33 -0400] "GET webpage.html HTTP/1.1" 400 236 - -Apache Webサーバーのアクセスログが正しい形式でないのはなぜですか?クラス内の

のように表示されます。ファイルを解析する方法は問いませんが、フォーマットが完了していない場合はどうなるのでしょうか?ユーザーのブラウザは失敗しましたか?停電? ect。

また、ファイルを解析すると、インデックス[8](200,300,400,500コードと思われる)の特定のインスタンスで、インデックス[8]が1.1 "になる間違いがあることに気付きました。

任意のアイデア

答えて

0

は?「 - 」だけフィールド情報は、(http://httpd.apache.org/docs/2.2/logs.html)利用できないことを示しているこれらの最後の二つのハイフンがちょうどことを意味します。

インデックスに関する第2の部分は、あなたが前提をaboにしているということですログラインのフォーマット方法。私はあなたがスペースで分けていて、ラインの先にスペースがあると確信しています。

+0

'GET webpage.html HTTP 1.1'のようなリクエストを誰かが送信した場合、2番目のリクエストはおそらく無効です。 – Swiss

+0

誰かがGET webpage.html HTTP/1.1"を送信したという問題があります。 tは1つですか? –

+0

@Seth、問題は、引用符の間の部分を1つのフィールドとして扱い、その中のスペースで分割しないことです。 –

関連する問題