2012-01-13 10 views
0

子供を反復処理:lxmlのパイソン - タグを抽出して、私は次のようにタグを取得するためにlxmlのを使用しています

el = doc.get_element_by_id('productDescription') 

私の理解elからは、ちょうどそのタグとその子が含まれています。

el.iterdescendants()を使用すると、私が抽出しているメインタグの外側にタグが表示されます。
これはどのように可能ですか? (これはamazon.comなので、DOMは良いです)。

el = doc.get_element_by_id('productDescription') 
for j in el.iterdescendants(): 
    print j.tag 

子孫で、タグや作業のみを抽出する適切な方法は何ですか?

+3

XMLのスニペットがありますか? –

+0

CSSSelector(lxml.cssselect import CSSSelector)を使用しても結果は異なりますか? –

+0

入力と出力を表示するといいでしょう。すべてが正しいように見えます(あなただけが子孫ではなく子孫を反復したい場合) – newtover

答えて

0

これは、はるかに信頼性があるので、あなたはCSSSelector

import CSSSelector 

を使用する必要があります!

関連する問題