html5libというユーザーからカスタムHTMLを検証しています。問題は、html5libがhtml
,head
とbody
タグを追加することです。これは必要ありません。html5lib。 html、head、bodyタグを追加せずに有効なhtmlを取得するには?
parser = html5lib.HTMLParser(tree=treebuilders.getTreeBuilder("simpleTree"))
f = open('/home/user/ex.html')
doc = parser.parse(f)
doc.toxml()
'<html><head/><body><div>\n <a href="http://speedhunters.com">speedhunters.com\n</a></div><a href="http://speedhunters.com">\n</a></body></html>'
これは、検証された消毒することができますが、どのように私は削除したり、木にこれらのタグを追加することを防止することができますか? replace
を使用しないことを意味します。
私は猫を持ちたいと思っていますが、脚を持つ必要はありません。 –
これはユーザーがカスタマイズできるページの一部です。ちょうどよい猫の尾が必要です。 – I159
十分に公正で、合理的な使用例です。ちょうどあなたをチェックすることは、ひどく乱された出力を作り出そうとしていませんでした。 –