2011-09-25 8 views
7

私はAndroidアプリケーションでいくつかのHTMLページを処理する必要があり、関連情報を抽出するためにXPathを使用することをお勧めします。Androidで最も優れたHTML DOMパーサーはどれですか?

(リスト5月:通常のJ2SEについてorg.w3c.dom.Documentに、通常のHTMLを解析するための可能な実装がたくさんあります不完全な - それhttps://stackoverflow.com/questions/2009897/recommend-an-alternative-to-jtidyから

から抽出されました。しかし、これらのライブラリがAndroid(ライブラリサイズ、CPUおよびメモリ消費量)で動作するかどうかを評価することは非常に複雑です。

あなたの経験に基づいて、Android用に選択したライブラリは何ですか?

答えて

2

OK、誰もその質問に答えることができないように見える - それから私はそれを自分でチェックしなければならない。

jTidy

私は、最新のjTidyソースをダウンロードし、それらをコンパイルし、私のAndroidアプリのライブラリとして作成したjarファイルを追加しました。私のアプリケーション(エミュレータと実際の電話)でjTidyを使用することに問題はありませんでした。実行時にjTidyもうまくいきますが、限られたAndroid環境には適していないようです。 10kbのhtmlファイルを解析してもLogcatの出力を見ると、ガベージコレクタが大量に動作します。

HTMLCleaner Android上でも素敵な作品HTMLCleaner私の経験から

。ライブラリのサイズは比較的小さい(v2.2では106KB)。しかし、それが作成する解析されたDOMは期待どおりではありません。例えば、HTMLCleanerはDOMに追加の<span>要素を挿入します。これは、HTMLファイルとして表示したいが、私のユースケースでは - XPath式で情報を拡張する場合は問題ありません - これは無駄です!

TagSoup

テストされていない

エリコ

テストされていない

NekoHTML

をテストしていない

JSoup

JSoupに

+0

何をテストしませんか? – Enigma

関連する問題