可能性の重複: Why UTF-32 exists whereas only 21 bits are necessary to encode every character? 最大UnicodeコードポイントはUTF-32から0x10FFFFあります。 UTF-32は21の情報ビットと11の余分なブランクビットを有する。それで、4よりも3バイトで各コードポイントを格納するためのUTF-24エンコー
私はテキストファイルを読み込むC++プログラムを持っています。現在私はCのfopen()を読んでからfgetc()を使って次の文字を読んでいます。 I typedef 'ファイル文字'は実際にはintです(明らかに問題なくlongに変更できます)。 このプログラムでは、UTF-7とUTF-8のテキストファイルを読むことができますが、UTF-16またはUTF-32テキストファイルを使用するとどうなり