-1
考えるとHTMLの構造を使用して属性を取得しますか?そうのようなXPathの
URL:
//*[@itemprop='actors']//*[@itemprop='name']/text()
は最初のa/text
を得ています。
考えるとHTMLの構造を使用して属性を取得しますか?そうのようなXPathの
URL:
//*[@itemprop='actors']//*[@itemprop='name']/text()
は最初のa/text
を得ています。
HTMLファイルには、次のtest.htmlというであると仮定すると動作するはずです:
from lxml import html
with open(r'E:/backup/GoogleDrive/py/scrapy/test.html', "r") as f:
page = f.read()
tree = html.fromstring(page)
names = tree.xpath("//a[@itemprop='name']//text()")
print names
をちょうど掲示リンクOPを見て、このフォーラムのために非常に不適切、あるいは虐待のようです。私はこれにフラグを立てている。もしあれば、懸念を提起する。 – SomeDude
あなたのxpathは正常に動作します –