ユニコードデータ(utf-8
エンコーディング)を含むバイト列(str
、unicode
ではなく、Python 2.7)の束があります。Python 2.7 string.join()with unicode
私は("".join(utf8_strings)
またはu"".join(utf8_strings)
で)それらを結合しようとしています
UnicodeDecodeError: 'ascii' codec can't decode byte 0xec in position 0: ordinal not in range(128)`
をスローした非ASCII文字列の.join()
方法を利用するために方法はありますか?私はforループでそれらを連結することができますが、それは費用対効果の高いものではありません。
「unicode」オブジェクトと「str」オブジェクトをアンミックスする方法はありますか? – fiona
@fionaはあなたのバイト文字列をUnicodeに決定してから参加します。可能な限り早くデコードするのが最善です。テキストの処理が完了したときにのみエンコードし、バイトを受け付けるようなものに渡す必要があります。 –