2012-09-27 25 views
7

PHP正規表現エンジンをテストすると、[0-9A-Za-z_]のみが単語文字とみなされています。ヘブライ語などのASCII以外の言語の文字は、単語の文字として[\w]と一致しません。任意の言語の文字と一致するPHPまたはPerlの正規表現のエスケープシーケンスはありますか?私は使用すると予想される各アルファベットの範囲を追加することができますが、ユーザーはいつも予想外の言語で私たちを驚かせるでしょう!任意の言語の単語文字用正規表現

これはセキュリティフィルタリングではなく、テキストをトークン化することに注意してください。

答えて

1

でリファレンスを参照してください。どんな言語のどんな種類の手紙にもマッチします。文字セット[]を使用したくない場合。

関連する問題