2016-03-20 12 views
0

私のHTMLは次のようである:C#でHTMLドキュメントから値を取得します

<i>Real Name:</i> Marcos Barbosa<br> 
<i>Country:</i> BR<br> 
<i>Account Created:</i> 03 Sep 2012<br> 
<i>Last Logoff:</i> 20 Mar 2016<br> 
<i>Status:</i> Online<br> 
<i>Visibility:</i> Public<br> 

どの/ I> BR>内の値を取得する最も簡単な方法はありますか?

+0

を何をしようとする:

が働くだろう。このようなあなたのデータのフォーマット(<br>タグは...など、クローズする必要がありますか)?単純なテキストの代わりに入力タグを使用するようにHTMLを変更できますか? – krillgar

+0

実際には、それは検索によって生成されたHTMLです。 –

答えて

1

これが単純な場合は、正規表現を使用できます。それ以外の場合は、Html Agility Packを使用できます。

たとえば、正規表現を使用して、あなたが一致することができます。

<i>Real Name:</i>(.+?)<br> 

または

<i>Real Name:</i>([^<]+)<br> 
0

は、あなたが使用できるの.NET FrameworkのXmlDocumentのパーサに建てられました。まず、そのようなXML文書を作成します。

  System.Xml.XmlDocument d = new XmlDocument(); 
      d.LoadXml(html); 

はその後、ノードを選択することで簡単にデータにアクセスすることができます。 ただし、データを解析するためにデータを少しフォーマットする必要があります。

<data> 
<i>Real Name:</i><a> Marcos Barbosa</a> 
<i>Country:</i><a> BR</a> 
<i>Account Created:</i><a> 03 Sep 2012</a> 
<i>Last Logoff:</i><a> 20 Mar 2016</a> 
<i>Status:</i><a> Online</a> 
<i>Visibility:</i><a> Public</a> 
<i>Visibility:</i><a> Public</a> 
</data> 
関連する問題