2012-01-24 7 views
-1

BeautifulSoupを使用していくつかのWebサイトをPythonで削っています。私は抽出したいウェブサイトのカウントダウンタイマーを見つけました。タイマーには、サイトの情報の残り時間が表示されます。いくつかのjavascriptメソッドが毎秒innerHTMLをトリガーしています。誰もそれを抽出する方法を知っていますか?Pythonを使用してWebページ上の動的時間カウンタを抽出する方法

+1

この情報では不十分です。あなたはそのページのHTMLとjavascriptについてもう少し詳しく教えてください。 –

+0

そして「誰でもそれを行う方法を知っている」というのは良い質問ではありません。あなたは、あなたが何を試してきたのか、いつまで止まらないのかを教えてください。そして、はい、サイトへのリンクが良いだろう。 –

答えて

0

無料のJavascriptのカウントダウンタイマーコードがGoogleの検索ではなく離れているため、スクリーンスクレイプしたい理由がわかりません。ここで私の好きなものはRobert Hashemianです:http://www.hashemian.com/tools/javascript-countdown.htm

しかし、まだそれを削りたい場合は、ウェブサイトのHTMLソースを調べる必要があります。タイマのjavascriptがドキュメントに埋め込まれている場合は、最初と最後の<script>タグと</script>タグを見つけて、その間にすべてをコピーする必要があります(これは、スクリプトをとらえなければならないため、スクリプトが(もっと可能性の高い)外部のjsファイルにある場合は、ファイルをダウンロードするだけです。

+0

これまでのところ、私はbeautifulsoupで静的コンテンツを取得することができましたが、これは動的なので、空の明らかに戻ります。私はfirebug拡張子を使用してデータを含むdivの属性を見つけました。私は外部のjsファイルをダウンロードする必要があります – Bharats

+0

例えば、私はこのページの右上隅にあるタイマーを取得したいhttp://www.snapdeal.com/deal-bangalore_mg_road_plus-tata-photon-blr – Bharats

+0

私はなぜあなたは利用可能なコードを使用できないのか分かりません。しかし、このウェブサイトのスクリプトは、少なくとも「」またはすぐに見える外部ファイルにはありません。 –

関連する問題