2009-07-21 24 views
0

ブラウザのスクリプトを作成する最も良い方法は何ですか?クライアントサイドスクリプトでhtmlを解析するにはどうすればよいですか?

私は窓の午前とFirefoxにすべてのほとんどを使用し、異なるドメイン

上の一部のHTMLページを解析する必要があります。それはあなたがそれをやりたいためにページを取得についてだけなら、ビルトインurllibモジュールpythonで

+2

。 –

+0

言語とオペレーティングシステムを選択してください。ブラウザを簡単にスクリプト化することはできませんが、ブラウザのようにWebページを取得して解析するプログラムを書くことはできます。 –

答えて

0

はあなたのためにそれを行います。

0

あなたがウェブページを検索し、意味のあるデータを抽出するためにそれらを解析したいようですね?私はあなたが直接使用することができる素敵なSAXイベントをオフに火災、またはあなたの選択(生DOM、JDOM、dom4jの、XOMなど)のXMLモジュールを使用(Java用)TagSoupようなものをお勧めします。 TagSoupページには、Pythonの美味しいスープ、RubyのRubyful Soupなどの他の言語の参考文献も多数掲載されています。

そこから、私はあなたがしたいデータのビットを取得するために、XPathのようなものを使用してお勧めします。もう1つの選択肢は、HTMLを、より簡単に操作できる統一フォーマットに変換するXSLTです。

関連する問題