HTMLタグの内容を取得するためのXPath式を作成するのに役立つクローラライブラリを使用しています。私は現在、ページからHTML5コンテンツを読み込んでいます。このようにしてタグに挿入されていないテキストを取得したいとします。 別の子要素の後にXPathを使用して子テキストを選択する方法
<div class="country">
<strong> USA </strong>
Some text here
</div>
は、だから私はここにこのテキスト
にいくつかのテキストを取得しようとしているが、クローラライブラリは、タグにだとないその外側だけでものを手に入れることができます。 これらは、クローラの一部です:
$crawler = new Crawler();
$crawler->xpathSingle($xml, '//div[@class="country"]/strong/@text');
XPath: '// div [@ class =" country "]/strong/following-sibling :: text()'を実行するとどうなりますか?私はこの "クローラー"ライブラリに慣れていないので質問します。このXPathはPythonでlxmlを使って動作します。 –
ありがとう、それは働いている。しかし、このテキストが別のタグに属していても、強力なタグの後ろのすべてのテキストを取得しています – KubiRoazhon