2012-05-12 24 views
4

私はwgetを使用し、URLからhtmlファイルを取得します。そのHTMLファイルからHARファイルを生成するにはどうしたらいいですか?HTMLファイルからHARファイルを生成するには?

  1. htmlファイルからharファイルを生成するためのオープンソースの実装はありますか?
  2. HARファイルが生成されたら、harlibを使用してHARファイルからデータを読み取ることができます。

可能であれば、C、C++またはJavaの実装を提案してください。

答えて

5

HAR形式の主なポイントは、多くのツールで使用および分析できる標準のHTTPトレース形式を使用することです。言い換えれば、それは当初の意図であり、主にパフォーマンス分析のためにウェブページ自体を「アーカイブ」することではありませんでした。

wgetでページを取得すると、すべてのパフォーマンスデータの99%が失われています。必要なデータを取得するには、リクエストを実行したり、関連するすべてのリソースを取得したり、タイマーをすべて保存したりするブラウザが必要です。

これをキャプチャする必要がある場合pcapを使用してTCPトレースをキャプチャしてからconvert that to HARを実行することができます。実際にHTMLを解析し、すべてのサブリソースを要求するクライアントが必要です(pcapはバックグラウンドでリスンしています)。また、ブラウザthrough a proxyをルーティングして、HARファイルを吐き出させることもできます。

最後に、デバッグインターフェイスを使用してブラウザを駆動し、そのようにHARファイルをエクスポートすることができます。 Firefoxを動かすためのJavaの例:https://github.com/Filirom1/browsermob-page-perf

関連する問題