2016-06-24 4 views
0

私はNodeからWebサイトから取得したテーブルを解析しようとしています。テーブルはこのように見えます。私はヘッダーを無視し、実際のトランザクションの本文を解析したいと思います。このHTMLテーブルを解析する最も速い方法は何ですか?

 <tbody><tr class="dgHeader" style="font-weight:bold;"> 
      <th scope="col">Reference 1</th><th scope="col">Reference 2</th><th scope="col">Reference 3</th><th scope="col">Reference 4</th><th scope="col">Gross Amount</th><th scope="col">Discounts/Surcharges</th><th scope="col">Net Amount</th><th scope="col">Means of Payment</th><th scope="col">Form of Payment</th><th scope="col">Payment Folio</th><th scope="col">Branch</th><th scope="col">Time</th><th scope="col">Maturity Date</th><th scope="col">Payment date</th>    </tr><tr align="left"> 
      <td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblReferencia1">0000000000000000000000000000000X4D649G66</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblReferencia2"></span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblReferencia3"></span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblReferencia4"></span> 
        </td><td align="right"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblImporteBruto">$40.00</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblDescuentosRecargos">$0.00</span> 
        </td><td align="right"> 
        <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblImporteNeto">$40.00</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblMedioPago">Internet</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblFormaPago">Cash</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblFolioPago">45786172008896142466 </span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblSucursal">4578</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblHora">01:48:59 p.m.</span> 
        </td><td> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblFechaVencimiento">00/00/0000</span> 
        </td><td align="left"> 
         <span id="ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblFechaPago">20/06/2016</span> 
        </td>   </tr>  </tbody> 

私はCheerioを使用していましたが、テーブルからデータを取得するためにidタグを取得するのに苦労しました。

+2

あなたの質問は何ですか?あなたのタイトル、質問の本文、コメントはすべて異なる質問をします。 –

+0

私は本当の質問を明確にし、以下の答えを掲載しました。残念ながら残念です。基本的にhtmlテーブルを解析してセレクタに基づいてテキストを取得する方法を理解したかったのです。 – user2044299

答えて

0

これで解決しました。リファレンスコードを簡単に入手できるようになりました。

$ = cheerio.load(str, { 
    ignoreWhitespace: true 
    }); 

$('tr').each(function(i, tr){ 
    var reference = $('#ctl00_Contentplaceholder1_gvConcentracionPagos_ctl02_lblReferencia1').text()) 
} 
関連する問題