ウェブ解析パッケージには、ページ内のユーザーのアクティビティに関する詳細情報が含まれており、ウェブページ上のオーバーレイ内での表示(クリック/スクロール/インタラクション)現在、これはページのライブレンダリングを含むIFrameです。レンダリングされたHTMLページのスクリーンショットの取得方法
ページが時間の経過とともに変化するため、古いデータはページの現在のレイアウトに対応しなくなります。私たちはスパイダーを実行して時々ページのスナップショットを撮って、ページのさまざまなバージョンとのやり取りの記録を維持できるようにしたいと考えています。
私たちはこれ(Linux)の実装を行っていますが、スナップショットプロセスはPython/JavaScript/HTMLハックでFirefoxウィンドウを開き、スクリーンショットを作成し、スクロールしてマージしてファイルに保存します。これは通常はヘッドレスサーバーにXスタックをインストールする必要があり、1ページに1分かかる。
一般的なWebブラウザのレンダリング時間に近いパフォーマンスのヘッドレス実装が望ましいですが、何も見つかりませんでした。
Mozillaソースを出発点として何かを構築する動きがありますが、これは私にとって過酷なように思えますし、最新のものを維持しようとするとメンテナンスの悪夢になるかもしれません。
提案?
私はこのために[wkhtmltopdf(http://code.google.com/p/wkhtmltopdf/)を使用します。 Xサーバが必要ですが、Xvfbで十分です。したがって、技術的にヘッドレスです。 – jrockway