を解析どんなHTMLライブラリをお勧めですか?長所と短所は?あなたは私はあなたが何HTMLパーサーをお勧めしますなどいくつかの属性/タグの値</p> <p>を見つけるためにいくつかのHTMLを解析するJava
答えて
私はデッドシンプルなHTML Parserを試しました。
私はプロジェクトでHTMLパーサを使用していましたが、それはちょうど期待通りに機能しました –
しかし、利用可能なチュートリアルはあまりありません... – Lily
JavaScriptのスニペット(および要素の属性) "抽出。また、不正な形式のHTMLが解析処理全体を失敗させる場合もあります。だから私は自分のプロジェクトのhtmlparserライブラリを少し上手くいくものに置き換えることを考えています。 – benjismith
HTMLを完全に解析する必要がありますか?内容(特定のタグ/パラメータ)内の特定の値を探しているだけなら、単純な正規表現で十分であり、非常に速くなる可能性があります。
- 1. emacsに見つからないhtmlタグを見つける
- 2. 私はこのようなHTMLでいくつかのhrefを見つける必要がありvb.netのasp.net
- 3. 私はHTMLページにswfファイルを埋め込むためにいくつかの方法を見つけましたhtmlページ
- 4. は、EC2インスタンスは、特定のメモリ/ストレージクォータが付属して、なぜ私はEC2、あなたの注意のためのおかげで、</p> <p>1)について、いくつかの初心者の質問があるAmazon EC2の
- 5. NSLogを見つけるためのRegExではなく、{\ r。* NSLog
- 6. いくつかのpython httpクライアントライブラリをお勧めしますか?
- 7. 私のシミュレーションに十分なアルゴリズムを見つけるためにいくつかアドバイスが必要です
- 8. 範囲内の異なる値を見つけるためにVBAに関数などがありますか?
- 9. 特定のHTML要素を見つけるためにJTidyから返されたDOMを解析します
- 10. ウェブサイト全体の1つのアドレス(www.domain.com)?あなたはSEOのためにそれをお勧めですか?
- 11. 画像からカラーパレットを生成できるjsライブラリはありますか?私はあなたがあなたのイメージをアップロードすることができ、それはあなたのための色を生成することになるが、私は私のウェブサイト上のような</p> <p>何かを置くために何かをしたいいくつかのウェブサイトがあります知っている</p> <pre><code><img class="image" ... /> $(".image").get_colors() </code></pre> <p>ような何かを行う可能性があります
- 12. 私は、URLの最後にいくつかの属性を置くために、このようないくつかのherfとメニューを持っているherf
- 13. 入力タイプは、のonmouseover <p></p>だから、このために、私は「モニター」ボタンのonmouseover属性のためだけの簡単なヒントを追加したいテキストを追加することが可能であるならば、私は参照を見つけることができないようonmouseover属性
- 14. Subversionのチェックアウト・エラー:私は避けるために何ができるかについて全く見当がつかない</p> <blockquote> <p>Missing update-report close tag</p> </blockquote> <p>:ミッシング更新レポート近いタグ
- 15. は、どのように私はこの答えはここにあるが、私はそれを見つけることができなかった(または私はそれを見たときに、少なくとも<em>は</em>それを認識!)</strong>を知っ<strong>HTMLの画像のsrcタグ
- 16. あなたが見た中で最もよく書かれたオープンソースプロジェクトのいくつかは何ですか?
- 17. <script>タグをHTMLでコメントする必要があるのはなぜですか?私が見てきた
- 18. nginxはエラーログをバッファしますか?私たちは、など、</p> <p>を修正するためにnginxのエラーログを見るために見ているが、いくつかは難しく、このようなファイルの短縮などのエッジケースを占め抱えている
- 19. RubyでHTTP経由で基本認証を行う方法は?多くのことを見た後、私が働いているようだいくつかの解決策を見つけましたが、ではない私のためにきた...</p> <p>たとえば、私はこのスクリプトを持っている
- 20. 楽しいプロジェクトのためにいくつかのオープンソースのWebフレームワークをお勧めします。
- 21. runat = "server"属性を持たないHTML要素を見つけよう
- 22. MySQLはだから私はいくつかの助けのためのあなたに回す</p> <p>..主な問題は、設計が不十分なPHPスクリプトであるので、この問題を回避するには... [OK]を
- 23. WEBAPI:私はいくつかの検索を行ってきたが、何かを見つけるように見えるしていない値
- 24. 行はこれは前に頼まれましたが、私はまだ私のために働いた何の解決策を見つけていない
- 25. は、文字列内のいくつかの変数名を見つけるために主要な数字
- 26. 私のデータベースにある大きなレコードのいくつかのためにcsvファイルを作成するには
- 27. gitのは、あなたは、いくつかの不審なパッチライン
- 28. いくつかの要素にカスタム属性を追加するためのJavascript
- 29. データベースライクな機能のためにコードを書くかCライブラリを見つける?
- 30. HTMLのいくつかの曲のためのシンプルなカスタム再生ボタン
XPathはHTML解析の方法です。形式の悪いHTMLの場合でも正規表現が失敗する場合に役立ちます。 –