2011-04-11 19 views
2

私は2つのXML間の違いを視覚化できるWebツールを作成しようとしています。 difflibは、違いをつけてhtmlを作成するのにはかなりうまくいきましたが、いくつかのUnicodeテキストがXMLに現れました。その結果、HTMLにはHTMLエンコードされた文字が含まれています。Pythonを使ってUnicodeを使ったXMLによるdiff

この問題の他の方法はありますか?

+0

HTMLのXMLおよびHTMLエンコード文字のUnicodeにはどのような問題がありますか?なぜそれがあなたをブロックするのですか? – JosefAssad

答えて

1

「html 文字エンティティ」とは何か気になりますが、数字の数字ではありません。あなたはそれらを再マップすることができます。正規表現(例えばsed)をサポートするあなたの好きなツールとunicode e-workersまたはreferenceのテーブルを使って数値エンティティエンコーディングはhtmlとxmlファイルで同様に使用できます。

大変お手数ですが、Carsten

関連する問題