ブラウザのスクリプトを作成する最も良い方法は何ですか?クライアントサイドスクリプトでhtmlを解析するにはどうすればよいですか?
私は窓の午前とFirefoxにすべてのほとんどを使用し、異なるドメイン
上の一部のHTMLページを解析する必要があります。それはあなたがそれをやりたいためにページを取得についてだけなら、ビルトインurllibモジュールpythonで
ブラウザのスクリプトを作成する最も良い方法は何ですか?クライアントサイドスクリプトでhtmlを解析するにはどうすればよいですか?
私は窓の午前とFirefoxにすべてのほとんどを使用し、異なるドメイン
上の一部のHTMLページを解析する必要があります。それはあなたがそれをやりたいためにページを取得についてだけなら、ビルトインurllibモジュールpythonで
はあなたのためにそれを行います。
あなたがウェブページを検索し、意味のあるデータを抽出するためにそれらを解析したいようですね?私はあなたが直接使用することができる素敵なSAXイベントをオフに火災、またはあなたの選択(生DOM、JDOM、dom4jの、XOMなど)のXMLモジュールを使用(Java用)TagSoupようなものをお勧めします。 TagSoupページには、Pythonの美味しいスープ、RubyのRubyful Soupなどの他の言語の参考文献も多数掲載されています。
そこから、私はあなたがしたいデータのビットを取得するために、XPathのようなものを使用してお勧めします。もう1つの選択肢は、HTMLを、より簡単に操作できる統一フォーマットに変換するXSLTです。
私はシンセティックスのWebをお勧めします。ここにjsFiddleでの実例があります。本当に非特異的である
jsFiddle http://jsfiddle.net/dwayne05/YkLVw/
シンセティックウェブ http://www.syntheticsweb.com/
。 –
言語とオペレーティングシステムを選択してください。ブラウザを簡単にスクリプト化することはできませんが、ブラウザのようにWebページを取得して解析するプログラムを書くことはできます。 –