2011-08-10 27 views
1

私はこのコードを使用して、このページの主要記事のテキストを検索しています。jsoupでこのhtmlページからテキストを取得するには?

public class HtmlparserExampleActivity extends Activity { 
String outputtext; 
    TagFindingVisitor visitor; 
    Parser parser = null; 
private static final String TAG = "TVGuide"; 



TextView outputTextView; 

/** Called when the activity is first created. */ 
@Override 
public void onCreate(Bundle savedInstanceState) { 
    super.onCreate(savedInstanceState); 
    setContentView(R.layout.main); 

    outputTextView = (TextView)findViewById(R.id.outputTextView); 
    String id = "main-article-content"; 
    Document doc = null; 

    try { 
     doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get(); 
    } catch (IOException e) { 
     // TODO Auto-generated catch block 
     e.printStackTrace(); 
    } 

    Log.i("DOC", doc.toString().toString()); 
    Elements elementsHtml = doc.getElementsByTag(id); 
    String[] temp1 = new String[99];  
    int i =0; 
    for(Element element: elementsHtml) 
    { 

     temp1[1] = element.text(); 
     i++; 
     outputTextView.setText(temp1[1]); 

問題は何もテキストビューに表示されていません。私が検索しようとしているテキストは表示されません。 Log.iは、デバッグログにセグメントを表示しています。だから私は正常に接続を知っている。ちょうど私がテキストビューでテキストを取得していない理由はわかりません。ここで

答えて

2

は、あなたの質問から関連性の単純化されたエキスです:

Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get(); 
Elements elementsHtml = doc.getElementsByTag("main-article-content"); 
// ... 

あなたがここに根本的な間違いを作っています。文書内に<main-article-content>のようなHTMLタグはありません。しかし、<div id="main-article-content">があります。このJsoup cookbookの途中のCSSセレクタの概要によれば、#idセレクタを使用する必要があります。

Document doc = Jsoup.connect("http://movies.ign.com/articles/100/1002569p1.html").get(); 
Element mainArticleContent = doc.select("#main-article-content").first(); 
// ... 
+0

ありがとう。あなたはDOMについて学ぶために私が何をしたいと思いますか、これに精通しているCSS? –

+1

HTMLとCSSを使っていくつかのウェブサイトを開発する(別の '.css'ファイルで!)。リンクされたJsoupの料理の概要は、本当に必要なものです。より高度な概要については、w3 http://www.w3.org/TR/CSS2/selector.html – BalusC

+0

すべてのヘルプありがとうございます。私はこれのすべてに新しい。混乱させて申し訳ありません。 –

関連する問題