C#とデータスクレイピングの新機能です。どうすればよいかわかりません。私はgoogleのいくつかのキーワードを検索し、次に検索結果のそれらのタイトルと説明とURLを取得する予定だったseocheki.netのURLを使用してもデータを抽出します。私はどうすればいいのですか?C#を使用して複数のサイトを掻き集める
私はまだGoogle検索結果を抽出するために何をすべきかわからないので、私はseochekiでデータを取得しようとしました。
私はseocheki
private async Task<List<Seocheki>> ResultFromSeocheki(int pageNum)
{
string url = "http://seocheki.net/site-check.php?u=http%3A%2F%2Fwww.gamerankings.com%2Fbrowse.html";
var doc = await Task.Factory.StartNew(() => web.Load(url));
var titleNodes = doc.DocumentNode.SelectNodes("//*[@id=\"td-title\"]");
var descNodes = doc.DocumentNode.SelectNodes("//*[@id=\"td-desc\"]");
var keywordNodes = doc.DocumentNode.SelectNodes("//*[@id=\"td-kw\"]");
var h1Nodes = doc.DocumentNode.SelectNodes("//*[@id=\"td-h1\"]");
var title = titleNodes.Select(node => node.InnerText).ToList();
var desc = descNodes.Select(node => node.InnerText).ToList();
var keyword = keywordNodes.Select(node => node.InnerText).ToList();
var h1 = h1Nodes.Select(node => node.LastChild.InnerText).ToList();
}
にデータを取得するためにHTMLAgilityPackを使用しようとしたが、これは、結果のデータをこすりする方法
のですか? HTMLAgilityPackは私にとってうまくいかないようです。
が表示されます。ご協力ありがとうございました! – Blake