私は私がさまざまなコーデックでエンコードされたテキストを表すバイト列のカップル持っているのpython 3.5バイトをasciiに変換し、Pythonで元に戻しますか?
を使用しています:b'mybytesstring'
、今いくつかはUtf8
他の符号化されているが、そうでlatin1
あると。私が次の順序でしたいのは:
- 文字列をASCII文字のような文字列に変換します。
- ASCII文字列のような文字列をバイト文字列に変換し直します。
- 正しいコーデックでバイト文字列をデコードします。
問題は、バイトオブジェクトを受け入れないものにバイト文字列を移動する必要があるため、私がbytes -> ascii -> bytes
を安全に行う解決策を探しているということです。あなたはこのためencode
とdecode
メソッドを使用して、彼らに希望のエンコーディングを供給
を考えていたよりもはるかに簡単である解決策を見つけ、あなたがオブジェクトbytes'、それぞれが異なって符号化 '異なってい意味ですか?私はあなたが 'バイト--ascii - > str - ??? - >バイト'をしたいことを理解していないのですか? –
はい私は、 'bytes'オブジェクトのグループにはすべて異なるエンコーディングがあります。 'bytes'オブジェクトだけを' string'オブジェクトだけ受け入れるコンテナにそれらをすべて入れる必要があります。その後、それらをコンテナから取り出し、適切なエンコーディングで正しくデコードすることができます。 – Thagor