Python pickleはバージョン間でユニコードに変換されます

私はPython 3.2を使用して辞書を漬けるプロセスを持っています。 Python 2.7または2.6を使用してこの辞書をunpickleする必要があります。問題は、Pythonのバージョン間で転送するときに私はそれをフィードしようとしているPythonのAPIを混乱させるユニコードのデータでいっぱいの辞書を取得することです。 Pythonの3.2Python pickleはバージョン間でユニコードに変換されます

酸洗：Pythonの2.6で

myDict = {'a': 'first', 'b': 'second', 'c': 'third'} 
with open(file, 'wb') as f: 
    pickle.dump(myDict, f, 2)

unpickle化：

with open(file, f) as f: 
    myDict = pickle.load(f)

戻り値：{u'a '：u'first'、u'c '：u'third' 、u'b '：u'second'}

私が入れたもの（つまり、ユニコードではないもの）をどのように戻すことができますか？

出典

2012-04-03 MappaGnosis

Python 3 are unicode

内の文字列がstr年代を取得するにはので、あなたが実際に、あなたが入れまさにバック取得している、あなたは辞書にキーと値を変換することができます：steefとして

strDict = dict((k.encode(), v.encode()) for k, v in myDict.iteritems())

出典

2012-04-03 11:56:29 Steef

Ah！私の誤解。私は3.xのすべての文字列がUnicodeであることに気づいていませんでした。 pre v3のドキュメントによると、protocol = 0はASCII形式になっていますが、何かが変更され、v3のドキュメントが 'ASCII'から ' 「人間が読める」（しばらく）。あなたの解決策は迅速かつ痛みはありません。ありがとう – MappaGnosis

あなたが入れたものを正確に返すようになりました.3 'foo'はUnicode文字列です（どちらのバージョンでも）b'foo'はバイト文字列です。

解凍後の解は、encode文字列をバイト表現に変換します。

代わりに、好きなエンコーディングで、たとえばyamlのようにデータをシリアライズするだけです。

出典

2012-04-03 12:05:37 Marcin

Python pickleはバージョン間でユニコードに変換されます

答えて

関連する問題