2012-11-06 6 views
5

Unicodeの特定の文字に対して視覚的に同じ文字を探したい。 文字の正準または互換性の分解を見つける方法を知っています。しかし、彼らは私が欲しいものを私に与えてくれません。 私は視覚的に同じ(類似していない)文字を見つけたいと思います。Unicodeの視覚的に同一の文字

たとえば、(S、S)または(S、S)(コードポイントが異なる)が必要です。 私は(ß、β)、(ε、é)を望んでいません。

提案がありますか?ありがとう。

+2

Unicodeは文字の外観を指定しません。それはフォントの問題です。 (標準では_representative_イメージを使用していますが、標準には含まれていません)たとえば、大文字Iと数字1と小文字lを一緒にしたいですか?いくつかのフォントでは、それらは同一であり、他のフォントではすべてが区別されます。 –

答えて

5

特定の文字については、Unicode標準のコードチャートの注釈から開始することができます。注釈は、多くの場合、類似性または形状の同一性を含むさまざまな理由で、他の文字を参照します。しかし、注釈はすべてをカバーするものではありません。

また、http://shapecatcher.com/にあなたのキャラクターを描いて、それを認識するように頼むこともできます。あなたは視覚的に似た選択肢の長いリストを取得することがよくあります。

@TedHoppがコメントに書いているように、ビジュアルアイデンティティはフォントに依存しています。例えば、「s」と「S」は同じ形状である必要はない。ほとんどのフォントでは、基本的な形式は同じですが、ストロークの幅の変化、曲率、セリフなどにはさまざまな違いがあります。ただし、一部の文字は、ラテン語の首都A、ギリシャの首都アルファ、キリル文字である。

調査の目的は指定していませんが、Unicode Consortiumによってある程度まで実行されている可能性があります。 UTR #6,ユニコードセキュリティの考慮を参照してください。UTS #9,ユニコードセキュリティメカニズム(confusables.txtが含まれています)、IDNの推奨混同マッピング(特定のコンテキストではありますが、他の目的のためにも興味がある)。