私は、Webページから行を正規表現しようとしています。次のように行は次のとおりです。Python Regexp problem
<tr><td width=60 bgcolor='#ffffcc'><b>random Value</b></td><td align=center width=80>
これは私が試したものですが、動作するようには思えない、誰も私を助けることができますか? 'htmlbody'にはhtmlページが含まれていますが、私は 're'をインポートすることを忘れませんでした。
reg = re.compile("<tr><td width=60 bgcolor='#ffffcc'><b>([^<]*)</b></td><td align=center width=80>")
value = reg.search(htmlbody)
print 'Value is', value
完全ではありません。
正規表現でこれを行う方法はありません。理由はCan you provide some examples of why it is hard to parse XML and HTML with a regex?を参照してください。何が必要HTMLParserのようなHTMLパーサーです:
出典
2009-04-17 23:22:47
関連する問題