2011-06-18 10 views
3

rereplace()関数で使用するRegExパターンを探していますが、アクセシブルなUTF-8文字を含むURLで安全な文字を保持します。たとえば、çおよびãです。UTF-8アクセントを許可するURLセーフ文字RegEx!

次のようなものがあります:url = rereplace(local.url, "pattern")など私はColdFusion専用のソリューションを好みますが、CFとの統合が容易なので、Javaを使用することもできます。私はあなたが使用している言語を知らない/posts/[postId]/[title-with-accents-like-ç-and-ã]

+0

あなたはどの言語を使用していますか? –

+0

@Chris Lutz、ColdFusionを使用しています。申し訳ありませんが、パターンを使用するだけの問題だと思ったので、私はその言語を含めませんでした。 – Mohamad

+0

@Chris、それはまた、Javaベースかもしれないと思います! – Mohamad

答えて

0

\wを使用してアルファベットの数字をマッチングすることによってこれを行うことができます。

rereplace(string, "[^\w]", "", "all")

参照用this answerを参照してください。

1

私のURLパターンは次のようになります。 Perlはいくつかのutf8のマッチングを持っています。たとえば、Tatsuhiko Miyagawa'sを参照してください。URI::Find::UTF8

+0

これでColdFusionを使用していることがわかりましたが、これがもう役に立たないことはわかりません。 PerlのRegexエンジンは非常に高度です(より低いエンジンとの互換性はありません)。最新バージョン(5.14.0)ではUnicode正規表現がさらに改善されました。 ColdFusionのマッチングが、おそらくPerlが役に立ちません。 –

関連する問題