2009-06-26 28 views
2

CharsetDecoder読み:UnmappableCharacterExceptionは何を意味しますか?

をデコードエラーの2つの一般的なタイプがあります。入力バイトシーケンスがこの文字セットで合法でない場合、入力はが不正な形式のとみなされます。入力バイトシーケンスが合法であるが有効なUnicode文字にマップできない場合、のマップ不可能な文字が発生しました。

不正な文字の概念を理解していますが、マップできない文字はどういう意味ですか?私は、Unicodeにはすべての可能な文字が含まれていると思いました。どのように正当なバイトシーケンスをUnicode文字にマップできないのでしょうか?

答えて

3

Unicodeは多数の言語で非常に多くの文字を表すことができますが、完全に網羅的ではありません。つまり、Unicodeへのマッピングがない文字セットの文字セットがあります。

0

だけの推測...

私は、このような値がまだ実装のために満たされていない空のブロックの一つに存在するだろうと期待しています。このエラーは将来、合法的な文字になるが、現在は存在しない値を予期している可能性があります。 Unicodeに含まれる文字セットは、進行中の作業であり、決して終了しない可能性があります(現在考慮中の文字についてはproposed charactersを参照してください)。

関連する問題