2016-08-03 6 views
-1

考えるとHTMLの構造を使用して属性を取得しますか?そうのようなXPathの

URL:

//*[@itemprop='actors']//*[@itemprop='name']/text() 

は最初のa/textを得ています。

+0

をちょうど掲示リンクOPを見て、このフォーラムのために非常に不適切、あるいは虐待のようです。私はこれにフラグを立てている。もしあれば、懸念を提起する。 – SomeDude

+0

あなたのxpathは正常に動作します –

答えて

1

HTMLファイルには、次のtest.htmlというであると仮定すると動作するはずです:

from lxml import html 

with open(r'E:/backup/GoogleDrive/py/scrapy/test.html', "r") as f: 
    page = f.read() 
tree = html.fromstring(page) 
names = tree.xpath("//a[@itemprop='name']//text()") 
print names 
関連する問題