にアクセスログを解析し、成功したすべての試行を記録するように割り当てられました。 Apache Webサーバーのアクセスログを調べる際に、いくつかの例がありました。形式が間違っていた約3/100,000のログです。ログは、たとえば、96.45.3.2 - - [14/Mar/2011:00:12:33 -0400] "GET webpage.html HTTP/1.1" 400 236 - -
Apache Webサーバーのアクセスログが正しい形式でないのはなぜですか?クラス内の
のように表示されます。ファイルを解析する方法は問いませんが、フォーマットが完了していない場合はどうなるのでしょうか?ユーザーのブラウザは失敗しましたか?停電? ect。
また、ファイルを解析すると、インデックス[8](200,300,400,500コードと思われる)の特定のインスタンスで、インデックス[8]が1.1 "になる間違いがあることに気付きました。
任意のアイデア
'GET webpage.html HTTP 1.1'のようなリクエストを誰かが送信した場合、2番目のリクエストはおそらく無効です。 – Swiss
誰かがGET webpage.html HTTP/1.1"を送信したという問題があります。 tは1つですか? –
@Seth、問題は、引用符の間の部分を1つのフィールドとして扱い、その中のスペースで分割しないことです。 –