2017-12-07 5 views
0

文字列のコードページを検出するにはどうすればいいですか?文字は2バイトです。 ansiコードに0x00を追加するだけで、特別なポーランド文字の場合、2バイトは特別な意味を持ちます。ファイルヘッドはありません。このようなバイトストリームだけです。文字列のコードページを検出するにはどうすればいいですか?文字の場合は2バイトです。

ここにサンプル

文字列:Połączenia

バイト:50 00/6F 00/42 01/05 01/63 00/7(a)00/65 00/69 00/61 00

Iユニコードの0x4201はポーランド語でない中国語の文字 であるため、ユニコードではないと思う。

だから誰でも私を助けることができますか?どうもありがとう!

答えて

2

そのUTF-16ビックエンディアン。

$ echo -n "Połączenia" | iconv -f UTF8 -t UTF16BE | hexdump 
0000000 5000 6f00 4201 0501 6300 7a00 6500 6e00 
0000010 6900 6100 
+0

多くのおかげで男、私はちょうど今、私の自己を発見したが、すべてのway.Iが早く尋ねるためにここに来るべきありがとう、私はそれを見つけるために、一日の半分を費やしています。 – thed

関連する問題