response.xpath('//*[@id="blah"]//text()')
私もその1個の<p>
タグかかわらず、テキストのリストを取得する何が起こっている私のHTMLは単一ノードscrapyのXPathの中にHTMLを含むすべてのテキストを取得
<p id="blah">This is a simple text <a href="#">foo</a> and this is after tag. </p>
であると仮定します。このような
[u'This is a simple text', u' and this is after tag.']
として私の実際のHTMLコンテンツは巨大であり、私はこれを達成するためにjoin
を行う必要があります。また、私はfoo
を失いますが、join
は失います。このための具体的な方法はありますか?xpath
scrapy
私は結果を得たい これは単純なテキストfooで、これはタグの後です。
ここでもfoo
に注目してください。
おかげ
https://stackoverflow.com/questio ns/40985060/scrapy-css-selector-get-all-inner-tags- – furas
xpathにも適用できますか? –