2017-01-28 10 views
0

からいくつかのリンクを取得し、私はこのHTML文字列

<a href="http://example.com/2014/06/22/new-idea-about-life.zip">One</a> 
<a href="http://example.com/2014/06/22/new-idea-about-life-rar.rar">Two</a> 

のような内容のいくつかの文字列を持っているIこの出力を必要とする:

http://example.com/2014/06/22/new-idea-about-life.zip 
http://example.com/2014/06/22/new-idea-about-life-rar.rar 
+1

は、HTML敏捷性パックを見てみましょう。これは、HTML文字列やファイルを扱いやすくするライブラリです。特にlinq-to-objectをサポートしています。タグから属性を抽出することもできます。これはここで行う必要があります。ありがとう。 – Umair

+0

ありがとう。それは助けを持っていますか?私はそれを使用する方法を知らない –

答えて

0

HTML Agility Packは、C#でHTMLを解析するための良いライブラリです。 URLを抽出するための

例は次のとおりです。

var html = "<a href=\"http://reallife.com/2014/06/22/new-idea-about-life.zip\">New idea about life (zip) (25MB)</a><a href=\"http://reallife.com/2014/06/22/new-idea-about-life-rar.rar\">New idea about life (rar) (23MB)</a> 
var htmlDoc = new HtmlDocument(); 
htmlDoc.LoadHtml(html); 
var links = new List<string>(); 
foreach (var link in htmlDoc.DocumentNode.SelectNodes("//a[@href]")) 
{ 
    links.Add(link.GetAttributeValue("href", string.Empty));  
} 
// do something with the links inside the links-List 
+0

私はこれを書いたが、私はこれらのerorsを得たhttp://uupload.ir/files/ksa2_untitled.png –

+0

あなたはそれを修正する方法を知っていますか? –

+0

ライブラリをインストールする必要があります。あなたはこれをしましたか?はいの場合は、それを参照する必要があります。 – Umair

関連する問題