私はすべてのタグストリップ以下のようにコードを持っている:<br>
タグを無視し、他のすべてのタグを削除する方法re.compile pythonのbr以外のすべてのタグを削除するには?
import re
def cleanhtml(raw_html):
cleanr = re.compile('<.*?>')
cleantext = re.sub(cleanr, '', raw_html)
return cleantext
payload = '<a href="asdasda.htm">I am inside</a><br/><p>Tagsssss</p>'
print cleanhtml(payload)
を?このコードは、すべての行を一緒に追加します。
「<(?!br\b).*?>」 – revo