UTF-8エンコーディングでUnicodeであるテキストファイルを読み込んで、このデータを別のテキストファイルに書き込む必要があります。このファイルにはタブで区切られたデータが行単位で表示されます。ユニコード以外のコードでUTF-8ユニコードファイルを読み取る
私の読書コードは、ユニコードをサポートしていないC++コードです。私がやっているのは、ファイルをstring/char*
で1行ずつ読み込み、その文字列をそのまま出力先ファイルに置くことです。私はコード変更提案を歓迎しないようにコードを変更することはできません。
私が知りたいことは、行単位で読むときに、行内でNULL終了文字( '\ 0')が発生する可能性があります。これは、Unicodeであり、1文字が複数バイトにまたがることができるからです。
私の考えは、NULL終端文字が行内で遭遇する可能性が非常に高いということでした。あなたの考え?
実際には、UTF-8は、ASCII範囲がそれぞれ1バイトで格納され、 'strcpy()に渡されたときに合理的に動作するエンコーディングを持つと便利です。とその友人。 – RBerteig