すべてを抽出する<object></object>

私はCURLを使用してページをダウンロードしています。今私はページからこれを抽出したいと思います：すべてを抽出する<object></object>

<object classid="clsid:67DABFBF-D0AB-41fa-9C46-CC0F21721616" width="640" 
     height="303.33333333333" 
     codebase="http://go.divx.com/plugin/DivXBrowserPlugin.cab" 
     id="object701207571"> 
    <param name="autoPlay" value="false" /> 
    <param name="custommode" value="Stage6" /> 
    <param name="src" value="" /> 
    <param name="movieTitle" value="Titanic" /> 
    <param name="bannerEnabled" value="false" /> 
    <param name="previewImage" 
      value="http://stagevu.com/img/thumbnail/oripmqeqzrccbig.jpg" /> 
    <embed type="video/divx" src="" width="640" height="303.33333333333" 
      autoPlay="false" custommode="Stage6" movieTitle="Titanic" 
      bannerEnabled="false" 
      previewImage="http://stagevu.com/img/thumbnail/oripmqeqzrccbig.jpg" 
      pluginspage="http://go.divx.com/plugin/download/" 
      id="embed701207571"> 
    </embed> 
</object>

助けてください！

出典

2009-04-04 user85491

私はあなたを助けているだろう私が何を意味しているか知っていれば、あなたはいくつかの考えを示して、試してみてください。そこには多くのRegexの例があります。 – bchhun

Can you provide some examples of why it is hard to parse XML and HTML with a regex?なぜこれがおそらく間違っているのかを参照してください。

あなたは、/(<object>.*?<\/object>)/sのようなもので逃げることができると言われました。これは、文字列"<object>"に続いて、文字列"</object>"までの任意の数の文字に一致します。最後のsは、改行に一致するように.に指示します（通常はそうではありません）。

出典

2009-04-04 14:33:43

+1最初の段落。 – strager