未加工のUTF-8をサポートする正規表現エンジンが必要です。つまり、UTF-8文字列は2つの文字(または1つ以下)としてchar *に格納されます。たとえば、Abは配列{0x41,0x62} 。 その形式を受け取れる正規表現エンジンを知っている人はいますか? 最初に必要な場合はwchar_tに変換できます。生のUTF-8をサポートする正規表現エンジン?
1
A
答えて
0
PCRE(リリース7.x)の現在の実装は、UTF-8のサポートを含む、5.10とmately近似します を対応 文字列とUnicode汎用カテゴリプロパティをコードしていました。ただし、UTF-8とUnicode のサポート を明示的に有効にする必要があります。デフォルトではありません。 Unicode テーブル は、Unicodeリリース5.1に対応しています。
2
This pageは、ICU libraryを設定して使用するという条件でBoost.Regexで可能であると言います。
0
UTF-8の非定数文字長の性質を扱うと、正規表現のようなアルゴリズムを作成するのが非常に難しくなります。
それはICUでユニコードのwstringにUTF-8文字列を変換してからboost::regex
のwstringのバリアントを使用することをお勧めします関連する問題
- 1. 正規表現検索エンジン
- 2. .NET用の代替正規表現エンジン、再帰をサポート
- 3. 正規表現検索をサポートする検索エンジンはありますか?
- 4. .NET正規表現エンジンはインラインモード修飾子をサポートしていますか?
- 5. MFCネイティブアプライアンスでの正規表現のサポート
- 6. Javascriptの正規表現チェックフラグのサポート
- 7. 正規表現の正規表現
- 8. JavaScriptの正規表現をPHPの正規表現にする
- 9. 正規表現エンジンは再帰的サブパターンで正規表現をどのように解析しますか?
- 10. Pythonの正規表現:れる発生
- 11. 正規表現 - 正規表現
- 12. 正規表現エンジンdk.brics.automatonでUnicodeを使用できますか?
- 13. 正規表現とハイパーリンクを解析する正規表現
- 14. preg_replace、正規表現を取得する正規表現
- 15. 正規表現をエスケープする正規表現
- 16. 正規表現を評価する正規表現
- 17. 正規表現を取得する正規表現
- 18. PHP正規表現に相当するJavascriptの正規表現
- 19. ある正規表現を含むが別の正規表現を除外する正規表現
- 20. 正規表現に一致する正規表現
- 21. 正規表現に一致する正規表現
- 22. 正規表現:表現
- 23. 正規表現
- 24. 正規表現
- 25. 正規表現
- 26. 正規表現
- 27. 正規表現
- 28. 正規表現
- 29. 正規表現
- 30. 正規表現