私は、非ラテンスクリプト(具体的には、日本語、簡体字中国語、アラビア語)を処理するためにPHPアプリケーションを適応しようとしています。アプリケーションのデータ検証ルーチンは、入力をチェックするために正規表現を頻繁に使用しますが、システムに追加のロケールをインストールすることなく他の言語に\ w文字の種類を適合させる方法がわかりません。PHPで非ラテンスクリプト入力の検証をどのように処理できますか?
私たちがサポートしている言語の数が増えるにつれて、アプリケーションに取り組んでいた以前の開発者は、正規表現に必要な文字を追加しただけです(コードでは[\wÀÁÂÄÅÆÇÈÉ... etc]私が今サポートしなければならないすべてのアルファベットのためにこれを本当に行います。
誰にもこの問題に対処する方法に関するアドバイスがありますか?
"検証" とは何を意味するのでしょうか?あなたはロケール対応の['ctype_alnum'](http://php.net/manual/en/function.ctype-alnum.php)を使用することができますが、あなたが求めているのは、"どの文字が英数字ですか?ロケール_ "... –
PHPでunicodeが壊れています。人々が働くことを知っているいくつかの図書館へのリンクを見るのはいいでしょう。 –
@ PHPのUnicodeはどのように「壊れていますか?ほとんどの基本的な文字列関数はそれを明示的にサポートしていません。うまく動作するもの。 – deceze