これは問題です。私が使用するスクリプトは、最初のタグを見なくなります。終了タグが親に表示されている場合、2つのタグ間ですべてを取得する方法はありますか?
私はウェブサイトを利用しています。これは私が「抽出したい」サイトの一部です。
<div class="i-want-this-div">
<div class="annoying-sub-div">
Bla bla bla
</div>
<div class="annoying-sub-div">
etc...
</div>
<div class="annoying-sub-div">
</div>
<div class="annoying-sub-div">
</div>
<div class="annoying-sub-div">
</div>
</div>
私が表示したいすべてのものを「迷惑」(彼らが台無しにそこにいることで、スクリプトの機能があるため)私のサイト上でのdivが、私はこれをどのように行うのですか?
これは私の現在のアプローチ:終了タグの位置を取得し、最初のタグの位置を取得し、全体のウェブサイトのソースを保持している文字列全体の形その部分を引きます。
$startPos = strpos($siteIAmScreaping, '<div class="i-want-this-div">');
$endPos = strpos($siteIAmScreaping, '</div>', $startPos) + 8;
$annoyingDivs = substr($siteIAmScreaping, $startPos, $endPos-$startPos);
問題がある:私はそれは、最初に見つかった終了タグにはタグではなくを閉じ、メインのdivに停止します。
あなたは何を求めているのかはまったく分かりません。 –
質問を編集します。 – SuperSpy