2012-01-10 15 views
0

からの情報をピックアップ:は、私は、リモートのWebサイトから情報を拾っていると私は、HTMLのこのビットとこだわっているリモートWebサイト

<div> 
     <a onclick="javascripthere" href="#"> 
      <img width="110" height="160" alt="" src="imageurlhere"> 
      {variable sized string} 
     </a> 
     <br>2012/01/10 17:35:20<br> 
     <img alt="{variable sized string}" src="imageurlhere"> 
</div> 

私は2をピックアップする必要があります上記のHTMLからの「{可変サイズの文字列} "。それらは任意のタイプの文字(a-zA-Z0-9および空白/その他の文字)にすることができます。これらの2つの文字列を取得するためにどのような種類の正規表現またはPHPを使用するかわかりません。

提案がありますか?

答えて

0

DOMDocumentを使用すると、HTMLまたはXMLの解析には適していない正規表現を使用する代わりに、これを行うことができます。あなたのコードは、はるかにクリーンで、最初は読みやすくなります。例えば

$doc = new DOMDocument(); 
$doc->loadHTML("<html><body><img alt="{variable sized string}" src="imageurlhere"></body></html>"); 
$images = $doc->getElementsByTagName('img'); 
foreach($images as $image) { 
    echo $image->getAttribute('alt'); 
} 

などphpquery(セレクタのようなjQueryのDOMをナビゲートするため)とSimple HTML DOM Parserとして簡単にAPIでのDOMDocumentをラップする多くのプロジェクトがあります。

0
$preg_match("/<img.*?>(.*?)<\/a>/", $string, $match); 

//$match[1] is your first string 

$preg_match("/<img alt=\"(.*?)\"/", $string, $match2); 

//match2[1] is your second string. 
関連する問題