2012-01-20 10 views
-1

これは問題です。私が使用するスクリプトは、最初のタグを見なくなります。終了タグが親に表示されている場合、2つのタグ間ですべてを取得する方法はありますか?

私はウェブサイトを利用しています。これは私が「抽出したい」サイトの一部です。

<div class="i-want-this-div"> 
    <div class="annoying-sub-div"> 
     Bla bla bla 
    </div> 
    <div class="annoying-sub-div"> 
     etc... 
    </div> 
    <div class="annoying-sub-div"> 
    </div> 
    <div class="annoying-sub-div"> 
    </div> 
    <div class="annoying-sub-div"> 
    </div> 
</div> 

私が表示したいすべてのものを「迷惑」(彼らが台無しにそこにいることで、スクリプトの機能があるため)私のサイト上でのdivが、私はこれをどのように行うのですか?

これは私の現在のアプローチ:終了タグの位置を取得し、最初のタグの位置を取得し、全体のウェブサイトのソースを保持している文字列全体の形その部分を引きます。

$startPos  = strpos($siteIAmScreaping, '<div class="i-want-this-div">'); 
$endPos  = strpos($siteIAmScreaping, '</div>', $startPos) + 8; 
$annoyingDivs = substr($siteIAmScreaping, $startPos, $endPos-$startPos); 

問題がある:私はそれは、最初に見つかった終了タグにはタグではなくを閉じ、メインのdivに停止します。

+1

あなたは何を求めているのかはまったく分かりません。 –

+0

質問を編集します。 – SuperSpy

答えて

0

DOMDocumentをこのようなものに使用します。

+0

少し説明できますか? div.i-want-this-divタグの間のすべてを取得するにはどうすればよいですか? – SuperSpy

-1

実際のコードを表示したいのですか?もしそうなら、あなたのコードをpreタグの中に入れてください。

<pre></pre> 

内のすべてがフォーマットされ、すべてのタグ/コードが表示されます。簡単にするために

+0

私は別のサイトの一部だけを抽出したいと思います。 – SuperSpy

+0

私はテーブルを盗んでみたい。 – SuperSpy

関連する問題