2011-07-08 23 views
0

今日私はJSoupを使用してアンドロイドアプリに使用していますので、データを抽出する必要があるこのテーブルを持っていますが、それは難しいと思われます。助けが要る;テーブルのHTMLは以下の通りです:htmlテーブルからデータを抽出するJsoup

<TR BGCOLOR='#999999'> 
     <TD ALIGN='left'><span class='S09W80'><font color=#DDDDDD>CODE</span></TD> 
     <TD ALIGN='left'><span class='S09W80'><font color=#DDDDDD>SUBJECT NAME</span></TD> 
     <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>PERIOD FROM</span></TD> 
     <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>PERIOD TO</span></TD> 
     <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>ENROL DATE</span></TD> 
     <TD ALIGN='right'><span class='S09W80'><font color=#DDDDDD>GRADE</span></TD>     
</TR> 

<TR BGCOLOR='#FFFFFF'> 
    <TD ALIGN='left'><span class='S09W50'>IT142</span></TD> 
    <TD ALIGN='left'><span class='S09W50'>INTRODUCTION TO GRAPHICS DEVELOPMENT</span></TD> 
    <TD ALIGN='right'><span class='S09W50'>21-FEB-11</span></TD> 
    <TD ALIGN='right'><span class='S09W50'>17-JUN-11</span></TD> 
    <TD ALIGN='right'><span class='S09W50'>22-FEB-11</span></TD> 
    <TD ALIGN='center'><span class='S09W80'>B-</span></TD> 
</TR> 

の繰り返しが続くが、どのように私はdoc.selectを使用してください。(使用するかを選択?)ここに ?

+0

追加するには、このhttp://shoquetechnology.blogspot.com/2011/05/parsing-data-from-html-post-table-using_29.htmlメソッドを自分の仕事に追加しましたが、追加する前にそれはテストに誰かが良いアイデアを持っていますか? – eddy

答えて

0

Androidの質問ではなく、CSSセレクタの質問です。あなたはそれについてもっと読むことができますhttp://www.w3.org/TR/CSS2/selector.html

このようなスクリーンスクレイピングは常に難しく、 "正しい"解決法はありません。

複数の選択ステップを実行する必要があります。

  1. "body> table> tr"のようなセレクタです。最初の要素を取る。これにより、最初のTR要素が得られます。
  2. TR要素を検証し、その子要素を取得し、そのうちの1つが "SUBJECT NAME"というテキストを持つことを検証します。
  3. 他のTR要素は、順番に処理できます。
関連する問題