私はPythonでプログラミングしており、ウェブページからurllib2
ライブラリを通じて情報を取得しています。PythonでUnicode(非ASCII)文字を扱う方法は?
File "c:\Python25\lib\httplib.py", line 711, in send
self.sock.sendall(str)
File "<string>", line 1, in sendall:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf1' in position 74: ordinal not in range(128)
は私が対処する必要があります。問題は、そのページはこの文字を取得する瞬間urllib2
でなど'ñ'
、'á'
、のように、それはこのように、例外を引き起こし、非ASCII文字を私に提供することができるということですそれらの文字。つまり、私は例外を処理するのではなく、プログラムを続行したいと思っています。たとえば、(これが何かばかげているかどうかわかりません)、ASCIIではなくcodecを使用する方法はありますか?これらの文字で作業する必要があるので、データベースなどに挿入してください。
Python 3以降やそれ以前のものを使用しているかどうかは言うまでもなく役に立ちます。 –
urllib2モジュールが削除されているため(urllibにラップされているため)Py3kできません... –
重複:http://stackoverflow.com/questions/1020892/python-urllib2-read-to-unicode –