2016-06-01 16 views
2

Scrapyを使用してデータをクロールしています。XPathを使用してリンクの内部テキストを選択するにはどうすればよいですか?

JSコンソールで私のブラウザにコンソールを入力すると、私は$x('//div[@class="summary"]//div[contains(@class, "tags")]')と入力して必要な情報を取得しますが、データをフィルタリングする必要があります。

次の写真は$x('//div[@class="summary"]//div[contains(@class, "tags")]')コマンドの結果です。

JS console result

どのように私は、緑色のボックス内のデータを取得するためにxpathコマンドを書く必要がありますか?私は$x('//div[@class="summary"]//div[contains(@class, "tags")]//a[contains(@class, "post-tag")]')を試してみましたが、それは私が欲しいものではありません。

ありがとうございます!

+0

なぜあなたは「のpython-2.7」をスキップしましたか?何が後ろの論理ですか? (私はそれがあなたが何を必要としているのではないかと思っています) – har07

+0

@ har07、私はJSコンソールのデータをフィルタリングする正しいxpathスクリプトを入手する必要があります。 [xpath](http://www.w3schools.com/xsl/xpath_intro.asp) –

+0

@ har07を参照してください、申し訳ありません、私はそれにボックスを置くことを忘れました。ありがとうございました!!! –

答えて

4

選択div<a>要素の内部テキストを選択するには、あなただけのdivを選択し、あなたのXPathに/a/text()を追加する必要があります。

//div[@class="summary"]//div[contains(@class, "tags")]/a/text() 
関連する問題