2016-09-29 3 views
0

私はPython 2.7のスクリプトを使ってウェブサイトから日付を抽出しています。コードは以下の通りである:lxml/xpath - 出力を制限する

from lxml import html, etree 
from urllib2 import urlopen 
import requests 

url = 'http://www.cardiffdevils.com/fixtures/' 
newtree = etree.HTML(urlopen(url).read()) 

for section in newtree.xpath('//div[@class="month"]'): 
    print section.xpath('h3[1]/text()') 
    print section.xpath('//td[@class="date"]/text()') 

ヶ月が正しく出力されているが、私は、対応する「月」クラス内で見つかったものだけにセクションごとに印刷された日付を制限しようとしています。現在のところ、ページ全体で見つかったすべての日付が吐き出されます。任意のポインタが評価されるだろう!

答えて

0
はピリオド( .)コンテキスト要素に、それは相対的にすると、あなたのXPathを起動し

Foreach not iterating through elements

+0

あなた:私はこの問題(異なる言語、異なるXPathプロセッサ)に関する答え

print section.xpath('.//td[@class="date"]/text()') 

最後の質問学者であり、私は紳士だと思います。それは私が必要とするものです。ありがとうございました! –