2012-02-13 21 views
0

RSSフィードからデータを取得しようとしていますが、ブログのコンテンツ/投稿の画像を取得するのに苦労しています。 <img>タグが<content:encoded><![CDATA[...]]></content:encoded>要素の内側にあるようです。rss xmlから画像を取得

私はこれにどう対応するのかよく分かりません。どんな助けでも大歓迎です。

それはRSSフィードの内容は何もすることができ、この

<content:encoded><![CDATA[ 
<p><img class="class1" title="hello world" src="http://www.mysite.com/images/myPhoto.jpg" alt="" width="550" height="227" /></p> 
<p><p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.</p> 
]]></content:encoded> 

答えて

0

のように見えます。多くのブログではHTMLをコンテンツに入れるだけで、毎回異なるHTMLを解析する必要があります。

HTMLを解析するには、XHTMLに変換してXPathを使用して検索したい要素を探します。

あなたはここに多くの助けが必要な場合(それがわかっている場合)、あなたは」

+0

コンテンツの構造を掲示する必要があるでしょうIVEは、今、私のオリジナルのポスト内のコンテンツの構造を掲載。使用している場合、助けてください: XmlSerializer serializer = new XmlSerializer(typeof(BlogNews)); XDocument document = XDocument.Parse(e.Result); –

+0

CDataの内容の構造は常に同じですか? –

関連する問題