1
このようなUTF-8でエンコードされた文字列持つ:スプリットは、UTF-8バイト与えられたエンコードされた文字列のオフセット(のpython 2.7)
bar = "hello 。◕‿‿◕。"
と私に語ったオフセットバイトはバイトで、私は分割する必要がありナッツで
>>first_part
'hello 。' <---- #9 bytes 'hello \xef\xbd\xa1'
>>second_part
'◕‿‿◕。'
:文字列:私は結果として二つの部分にバー文字列を分割する方法を
bytes_offset = 9
hell:
バイトオフセットが与えられていますが、utf-8でエンコードされた文字列の実際のcharインデックス位置でどのように変換できますか?
私は 'assert(isinstance(bar、str))'または 'assert(type(bar)is str)'を意味すると思います。 – agf
何らかの理由で私はisinstance()のオペランドの順序を思い出すことができません。 –