あなたは私はあなたが何HTMLパーサーをお勧めしますなどいくつかの属性/タグの値</p> <p>を見つけるためにいくつかのHTMLを解析するJava

NekoHTML TagSoup JTidyは、HTMLを解析してXPathなどのXMLツールで処理できるようにします。

2008-08-25 19:22:20 jelovirt

XPathはHTML解析の方法です。形式の悪いHTMLの場合でも正規表現が失敗する場合に役立ちます。 –

私はデッドシンプルなHTML Parserを試しました。

2008-08-25 18:55:11 pek

私はプロジェクトでHTMLパーサを使用していましたが、それはちょうど期待通りに機能しました –

しかし、利用可能なチュートリアルはあまりありません... – Lily

JavaScriptのスニペット（および要素の属性） "抽出。また、不正な形式のHTMLが解析処理全体を失敗させる場合もあります。だから私は自分のプロジェクトのhtmlparserライブラリを少し上手くいくものに置き換えることを考えています。 – benjismith

HTMLを完全に解析する必要がありますか？内容（特定のタグ/パラメータ）内の特定の値を探しているだけなら、単純な正規表現で十分であり、非常に速くなる可能性があります。

2008-08-25 18:56:36 Herms

答えて