2013-07-01 10 views
7

Unicode文字があれば、どの文字列がこの文字を含むかを調べる必要があります。さらに重要なのは、各言語がLeft-To-Rightであるかどうかを理解することです。 たとえば、文字Aは、両方ともLTR言語であるEnglishSpanishの両方である場合があります。文字から言語をどのように見つけることができますか?

私は自分のテキストエディタでこれを使用します。 誰かが私の問題を解決するAPI関数または何かを見つけるのを助けることができますか?事前

+3

Windows用のAPIはないと思います。私はあなたがこれを行う方法は、Unicode文字データベースの独自の検索を実行することです:http://www.unicode.org/ucd/またはそれを行うライブラリを見つけることです。私はICUがそうするだろうと思う。 –

+0

⌬、∬、✄、Whatはどうですか? –

+2

@AndreasRejbrand BIDIは中立です。それはすべてUCDにあります。 –

答えて

7

ユニコード単位で

おかげで、LTR/RTLは、文字のではなく、その文字を使用する言語の特性です。これは、簡単にするために、文書全体がアラビア語としてマークされていても、アラビア語テキストの埋め込み英語を左から右に表示する必要があるためです。 JCLを使用している場合、これらのプロパティはUnicodeIsLeftToRightと​​関数を使用して取得できます。文字は左から右でも右から左にもできないことに注意してください。また、JCLはUnicode文字リストのプライベートコピーを使用します。これはWindowsの特定のバージョンが使用するものとは微妙に異なるバージョンです。

1

タイトルの質問については、世界の言語での文字の使用について広範な調査を行う必要があります。それらの多くには通常の書記体系がありませんが、数千の言語があります。一方、いくつかの言語はいくつかの筆記体系を持っています。言語の異なる変形は、文字の異なるレパートリーを有することができる。

いくつかのデータがコンパイルされていますが、大きな努力が必要です。 CLDRのレパートリーにありますが、「言語で使用される文字」という概念ははっきりしていません。 (英語のæ、è、öは英語で書かれていますか?)

このような目的のためにライブラリルーチンを見つけるのは現実的ではありません。

実際には、文字が左から右の文字か右から左の文字かを判断する必要がありました。しかし、完全性のために、私はあなたが実際に尋ねたものと、他の文脈では関連性のあるものに対する答えを提示しました。

関連する問題