HTMLダンプを解析する効率的な方法は、文字列の形で見つかりました

この些細な質問にお答えください。これは、stackoverflowのビットとピースで利用できます。HTMLダンプを解析する効率的な方法は、文字列の形で見つかりました

私は、WebサイトのHTMLダンプをString形式で持っています。私はそれの特定のタグからテキストを抽出したい。

は、他の方法で、私はそれがフォームのHTMLダンプを返すWebサイト（私はそのために別のサービスを持っているに接続したくないので、私はJsoupを使用していない

Document doc = Jsoup.connect(url).userAgent("Mozilla").get(); 
Elements links = doc.getElementsByTag("cite");

を模倣したいですのテキスト）。テキストをHTMLDocumentに変換するのにHTMLEditorKitが見つかりましたが、JsoupやHTMLParserのように使いにくくないか、取得できません。

助けが役に立ちます。

ありがとうございました。

Jsoupを使用していてまだ動作している場合は、引き続き使用する必要があります。

Document doc = Jsoup.parse("<html>...");

とする必要があります。

は、以下を参照してください。The API

2012-04-13 06:47:09

以上完全に、 'ドキュメントドキュメント= Jsoup.parse（myHtmlString）;' – bdares

@bdaresうん、おかげで。 –

ありがとう！ :)私はこれを試していないので、とても愚かだった！ – instanceOfObject

答えて