ターゲットエンコード(CP 1047)でサポートされていない文字を含む文字列をエンコードしようとしています。Unicode文字を同様のEBCDIC 1047文字に自動的にマップします。
これらの文字をcp1047に相当するものにマッピングする標準/共通/簡単な方法はありますか?
たとえば、テキストには空白の二重引用符(”
)が含まれており、それをまっすぐな二重引用符("
)に変換します。
明らかに私のコードで置き換えを行うことができますが、より良い方法ですか?私が知らないオープンソースツールやAPIはありますか?
大多数のUnicode文字は、同等のCP1047文字を持っていません。 – SLaks
「同等」を定義してください。 –
この質問http://stackoverflow.com/questions/4808967/replacing-unicode-punctuation-with-ascii-approximationsまともな見た目の変換テーブルを持つこのWebページを指します。http://lexsrv3.nlm.nih.gov/LexSysGroup /Projects/lvg/current/docs/designDoc/UDF/unicode/DefaultTables/symbolTable.html – msandiford