2012-03-12 11 views
1

を内部属性/タグを読んで、私は、複数のウェブサイトからRSSフィードを読み取ろうとしましたが、このうちのいくつかは、このサンプルのように、奇妙な方法であなたのサービス(RSS)を公開:RSS項目に

<item> 

    <title>"2012 Minutos a Nadar" em Guimarães</title> 
    <link>http://www.rtp.pt/noticias/index.php?article=534537&amp;tm=3&amp;layout=123&amp;visual=61</link> 
    <description> 
    <![CDATA[ 
<img src="http://img0.rtp.pt/icm/thumb/phpThumb.php?src=/noticias/images/40/4031dece9b6d9384a6a021244cb0a36d&amp;w=620&amp;sx=0&amp;sy=10&amp;sw=560&amp;sh=307&amp;q=75&w=115"/> 
Esta noite as piscinas municipais de Guimarães não vão encerrar. Vão ser 2012 minutos a nadar 
sem paragens nem interrupções. Começou às 9 e meia da manhã e segue até ao final de domingo 
Um encontro desportivo no âmbito da Capital Europeia da Cultura. A ideia passa pela festa da natação com cada um a nadar o que puder num máximo de 200 metros. As inscrições estão permanentemente a decorrer. 

]]> 
</description> 

<guid>http://www.rtp.pt/noticias/index.php?article=534537&amp;tm=3&amp;layout=123&amp;visual=61</guid> 

<author>[email protected]</author> 
<category>Desporto</category> 
<category>Cultura</category> 
<category>País</category> 
<pubDate>Sat, 10 Mar 2012 16:42:02</pubDate> 
</item> 

にです私のためにdescritpitonタグで 'img'を得ることができますか?または、この属性を除脂肪タグから除外します。

またはこのサンプルで

<description><![CDATA[<p></p>]]>O militar norte-americano suspeito de ter matado 16 civis afegãos no domingo será julgado pela justiça militar dos Estados Unidos, anunciou esta segunda-feira o Pentágono./description> 

その可能htmlタグの記述から '

' を削除しますか?あなたは、CDATAセクションを解析しなければなら事前

答えて

1

おかげで、しかし、CDATAが有効なXMLを含む必要がないことに注意してください - それは、CDATAのポイントです。

+0

これを解析するにはどうすればよいですか?文字列のようなこのセクションを読んでください!ありがとう – mastervv

+1

いくつかの方法があります。私が正確性を気にかけずに、イメージURLを取得することだけを気にしていたなら、私は正規表現を選ぶかもしれません。あるいは、HTMLでラップし、HTML DOMに解析してから画像をスキャンすることもできます。 –