2012-07-10 15 views
6

可能性の重複:
Decode HTML entities in Python string?Pythonを使用してHTMLエスケープ文字を置き換えるにはどうすればよいですか?

私は、このような"”、および—などのHTMLエスケープ文字の完全な文字列を持っています。

すべてのPythonライブラリは、これらのエスケープ文字をそれぞれ実際の文字に置き換える信頼できる方法を提供していますか?

は例えば、私はすべての" sがS」に置き換えたい

+0

[string.replace](http://docs.python.org/library/string.html#string.replace) –

+0

利用美しいスープます。http:// lxmlの.de/elementsoup.html – sateesh

答えて

14

あなたはこれを使用したい:。

from HTMLParser import HTMLParser 
parser = HTMLParser() 
html_decoded_string = parser.unescape(html_encoded_string) 

私も

from BeautifulSoup import BeautifulSoup 
html_decoded_string = BeautifulSoup(html_encoded_string, convertEntities=BeautifulSoup.HTML_ENTITIES) 
BeautifulSoup

のためにたくさんの愛を見ています

また、これらの既存の質問の重複:

Decode HTML entities in Python string?

Decoding HTML entities with Python

Decoding HTML Entities With Python

+1

重複していることが分かっている場合は、(rep以外の)返信する代わりにフラグを立てるのはいかがですか? – kapa

+1

人々は、特にこの場合、正確なレプリカが非常に多いときに、既存の質問に対する回答を探す時間がかかりません。しかし、私は時にはコミュニティの過信を感じます。質問を誤解していて、本当に重複していない場合はどうなりますか?質問に答えると意味のある会話/スレッドが発生し、質問と回答が別の方向に向かうとどうなりますか?また、本当に評判に関するものではなく、一旦質問が閉じられたり、それに関連する評判が削除されたりすると、無効になることがあります。 –

+1

私は、ここでStackOverflowの一般的に受け入れられている行動規範について警告しました。あなたが少し気にしているようでしたら、私はこれに関するMetaの質問を調べるでしょうが、興味があればあなた自身で見つけることができると思います。私はこれについて議論に入ることを望んでいない、私はちょうどメッセンジャーだった、あなたが望むように:) – kapa

関連する問題