次の2つのコードスニペットが異なる出力を与えるのはなぜですか?唯一の違いは、最初のケースのh1
タグが、2番目のケースのh
タグに置き換えられている点です。これは、h1
タグにhtmlの特別な「意味」があるためですか?私はh1
からh6
まで試してみましたが、どれもh7
で出力として[u'xxx']
と出てくる間に、すべて出力として[]
を与えました。h1-h6タグでのscrapy xpathセレクタの動作
from scrapy import Selector # scrapy version: 1.2.2
text = '<h1><p>xxx</p></h1>'
print Selector(text=text).xpath('//h1/p/text()').extract()
Output[1]: []
text = '<h><p>xxx</p></h>'
print Selector(text=text).xpath('//h/p/text()').extract()
Output[2]: [u'xxx']
印刷物(s.extract())が何を伝えてくれてどうもありがとう! – FJDU