2016-11-30 7 views
0

lxmlライブラリを使用して、HTMLページから属性値を取得しています。例えばlxmlを使用した属性値の抽出

<span class="you-save">Rs. 5000</span> 

私は例えば

<meta itemprop="price" content="4999.00"> 

、私は属性値を取得したい

print doc.xpath('//span[@class="you-save"]//text()') 

の下に使用して正しい結果(5000)を取得しています"4999.00"を抽出します。私はこれを理解することができません。

私は以下を試しましたが、結果は得られませんでした。

答えて

1

@を使用して属性軸を使用して属性値をフェッチします。例えば

from lxml.etree import fromstring 

xml = """<some> 
<nodes> 
<meta itemprop="price" content="4999.00"></meta> 
</nodes> 
</some>""" 

doc = fromstring(xml) 
print(doc.xpath('//meta[@itemprop="price"]/@content')) 
関連する問題