lxmlのパイソン - タグを抽出して、私は次のようにタグを取得するためにlxmlのを使用しています

el = doc.get_element_by_id('productDescription')

私の理解elからは、ちょうどそのタグとその子が含まれています。

el.iterdescendants()を使用すると、私が抽出しているメインタグの外側にタグが表示されます。
これはどのように可能ですか？（これはamazon.comなので、DOMは良いです）。

el = doc.get_element_by_id('productDescription') 
for j in el.iterdescendants(): 
    print j.tag

子孫で、タグや作業のみを抽出する適切な方法は何ですか？

2012-01-13 Anonymous

XMLのスニペットがありますか？ –

CSSSelector（lxml.cssselect import CSSSelector）を使用しても結果は異なりますか？ –

入力と出力を表示するといいでしょう。すべてが正しいように見えます（あなただけが子孫ではなく子孫を反復したい場合） – newtover

これは、はるかに信頼性があるので、あなたはCSSSelector

import CSSSelector

を使用する必要があります！

2012-01-17 10:30:31

答えて