私は単純なファイルパーサーとライターを書いたが、その後ユニコードの重要性について話をした記事が出てきて、入力ファイルがASCIIコードであると仮定しているそれは私の状況ではまれではあるが、常にそうではないかもしれない。PythonでUTF-8に似たパーサーを書く
これらのまれなケースでは、私はUTF-8エンコードファイルを期待しています。
読み書き方法を変更するだけで、UTF-8ファイルを操作する方法はありますか?私がストリングを使って行うことは、それらを保管してから書き出すことなので、私はそれらを読んだり、保管したり、正しく書き込んだりすることができます。
さらに、asciiファイルとUTF-8ファイルを別々に扱い、それぞれ別々の関数を書く必要がありますか?私はまだASCIIファイル以外のものを扱っておらず、ユニコードの扱いについてしか読んでいません。
ASCIIはUTF-8のサブセットであるため、2組のコードは必要ありません。 –