2016-05-31 40 views
0

urllib2を使用してサーバーから文字列を取得します。私は、文字列は、このようにする必要があり期待し :私はそれを印刷するときurllib2を使用してサーバーから非ASCII文字列を取得する

Bouteflika veut croire qu'il est un dirigeant hors du commun aimé de son peuple. 

はしかし、それはこれを好き:

Bouteflika veut croire qu'il est un dirigeant hors du commun aim\\u00E9 de son peuple. 

これは文字列を取得するために私のコードです:

import urllib2 

response = urllib2.urlopen(url) 

page_source = response.read() 

print page_source.decode('utf-8') 

私の質問は、私は期待どおりの文字列を得ることができますか?

+0

「print repr(page_source)」とは何ですか? – jfs

答えて

0

これは、サーバーからの応答の送信方法によって異なります。

レスポンスがJSONの場合、エスケープされた文字やエスケープ文字が二重引用符で囲まれます。

あなたは

import json 
result = json.loads(response_text) 

が必要であることを復号化するために、生じた直接Unicode文字列になります。

+0

私はあなたのコードを使用して、今私はこのようなものを手に入れます: "Bouteflika veut croire qu'il est un dirigeant hors du commun aim \\ u00E9 de son peuple。"それにはまだ 'aimé'の代わりに 'aim \\ u00E9'が含まれています –

関連する問題