私はアプリケーションからジェリコパーサーを使用して、軽量版のWebページを取得し、そこからいくつかの部分を抽出します。ですから、例えば、私はこのコードを取得する場合:JerichoパーサーがこのHTMLコードを解析できないのはなぜですか?
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN/" "http://www.w3.org/TR/html4/loose.dtd"><html> <head> </head> <body> <b> <span class="articletitletext">Happy New Year!</span></b> <br> <span class="postedstamp">Posted By <script language="JavaScript" type="text/javascript"> <!-- document.write('<a href=" mailto:chris.wyman@verizon.net">'); // --> </script>Chris</a> on January 1, 2012</span><br> <br> <span id="intelliTXT">
From all of us here at TheForce.net, we wish you and your family a safe and Happy New Year. May the Force be with you in 2012!
</span></body> </html>
私はエリコパーサーを使用して、もう一度それを解析したいのですが、私は
ArrayList<Element> centerElems=(ArrayList<Element>) pageSource.getAllElements(HTMLElementName.CENTER);
を実行したときに、私はこの例外を得た
01-01 10:46:37.518: ERROR/AndroidRuntime(648): java.lang.RuntimeException: Unable to start activity ComponentInfo{net.test.theforce/net.test.theforce.NewsListActivity}: java.lang.RuntimeException: java.lang.ClassCastException: java.util.Collections$EmptyList
アプリケーションがクラッシュする...そう、軽いページで何が問題になっていますか?
あなたはそれ以外の場合は、全体の多くのdiffのだが、例外を投稿する必要があります... – AHungerArtist
logCatから取得したエラーメッセージで更新しました – user1012480
スタックトレースを取得していませんか、貼り付けたものを正確に取得できますか? – AHungerArtist