2012-12-30 11 views
6

私はpython webkit.WebViewとgtkを使ってウェブページをクロールしています。しかし、Webページはjavascriptによって動的に読み込まれます。ページが本当に完全に読み込まれていることを確認するにはどうすればよいですか?

WebViewの「読み込み完了」イベントではこれを処理するには不十分です。ページが実際にはJavaScriptのコンテンツでも読み込まれていることを知らせるインジケータ/イベントはありますか?

おかげで、

答えて

4

そのページが完全にロードされた場合に決定するための現実的な方法はありません。

1つの方法は、最後の要求以来の時間を決定することです。ただし、一部のページでは繰り返しリクエストが繰り返されます。これは、スクリプトといくつかの広告スクリプトを追跡することと共通しています。

ウェブビューで読み込みが完了したら、設定された時間を使用します。5秒程度です。それは完璧ではありませんが、あなたが得た最高のものです。任意のページの「完全に読み込まれた」ものを特定する方法がないためです。

関連する問題