いいから、テーブルからデータを取得するにはライブWebサイトを照会する必要があります。このHTMLテーブルをDataTableに入れてからこのデータを使用します。私は今までHtml Agility PackとXPathを使用してテーブルの各行にアクセスしていましたが、DataTableに解析する方法が必要であることは知っています。 (C#の)私は現在使用しているコードは次のとおりです。HTMLテーブルからデータテーブルにデータを取得する
string htmlCode = "";
using (WebClient client = new WebClient())
{
htmlCode = client.DownloadString("http://www.website.com");
}
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlCode);
//My attempt at LINQ to solve the issue (not sure where to go from here)
var myTable = doc.DocumentNode
.Descendants("table")
.Where(t =>t.Attributes["summary"].Value == "Table One")
.FirstOrDefault();
//Finds all the odd rows (which are the ones I actually need but would prefer a
//DataTable containing all the rows!
foreach (HtmlNode cell in doc.DocumentNode.SelectNodes("//tr[@class='odd']/td"))
{
string test = cell.InnerText;
//Have not gone further than this yet!
}
HTMLテーブルのウェブサイト上で私はこのようなルックスを照会しています:私はそれがが容易/優れているかどうかわからないんだけど
<table summary="Table One">
<tbody>
<tr class="odd">
<td>Some Text</td>
<td>Some Value</td>
</tr>
<tr class="even">
<td>Some Text1</td>
<td>Some Value1</td>
</tr>
<tr class="odd">
<td>Some Text2</td>
<td>Some Value2</td>
</tr>
<tr class="even">
<td>Some Text3</td>
<td>Some Value3</td>
</tr>
<tr class="odd">
<td>Some Text4</td>
<td>Some Value4</td>
</tr>
</tbody>
</table>
希望の結果を得るためにLINQ + HAPまたはXPath + HAPを使用すると、おそらく見ることができるように、私は両方とも限定的な成功を収めました。これは私がこれまでにウェブサイトを検索したり、ウェブサイトとのやりとりをするプログラムを作ったのは初めてです。事前に助けていただきありがとうございます:)
これは役に立ちますか? http://weblogs.asp.net/grantbarrington/archive/2009/10/15/screen-scraping-in-c.aspx – iwayneo