2012-04-06 11 views
1

正規表現に関するヘルプが必要です。スウェーデン語のパターンマッチング

私はこのような文字列に一致する必要があります。私が使用している âãa34dc

パターン:

\ [-ZA-Z] + [-ZA-Z_0-9] * * S \ s

このパターンは、この種の文字列を識別するのには十分ではありません。 âaa34dc

P.これらはスウェーデンの特徴です。

この種の文字列の正しいパターンを見つけてください。

+0

既存の回答の有効性を変更しないおそれがある小修正。「â」と「ã」は、外国の名前や場所のスペルを除き、スウェーデン語では使用されません。 OPが望むものはおそらく "åäö/ÅÄÖ"です。 – allansson

答えて

0

ルールのセットを教えてください。

あなたの質問に応じて:

[X-Ya-zA-Z]{3}[0-9]{2}[a-zA-Z]{2} 

最初のスウェーデン語の文字

でXを交換し

+0

ルールは英語のアルファベットと同じです。名前はスウェーデン語の文字で始まる場合もあれば、英語のアルファベットで始まる場合もあります。だから私は上記のように私の条件のすべてに合った後ろが欲しい。あなたのお時間をありがとうございます、ご不明な質問をお寄せいただきありがとうございます。 – user1213444

0

John Machin最後のスウェーデン語の文字とYを交換し、このための偉大な答えを提供します。彼のパターンを適応させるために、あなたが必要とするのはおそらく次のようなものです:\s*[^\W\d_]\w*\s*

P.S.私はあなたの最初の部分から+量子を削除しました。後続の文字は、後に定量化された\wによって照合されます。

+0

ルールは英語のアルファベットと同じです。名前はスウェーデン語の文字で始まる場合もあれば、英語のアルファベットで始まる場合もあります。数字とアンダースコアも含まれます。だから私は上記のように私の条件のすべてに合った後ろが欲しい。あなたの答えは私の問題を解決するために私を助けてくれません。 – user1213444

+1

いいえ、 '\ w'は' [A-Za-z0-9_] 'と同じではありません。 Unicode対応環境(.NETなど)では、 '\ w'は任意のアルファベット(スウェーデン語を含む)の任意の文字と一致します。私のパターンを実際に試してみましたか? – Douglas

3

実際にスウェーデン語に制限しますか?言い換えれば、ドイツ人のキャラクターは一致しないのでしょうか?もしそうなら、おそらくアルファベット全体を列挙し、それを含める必要があります。

すべてのアルファベット文字に一致するようにするには、正規表現の用語をすべての文字にマッチさせます。

\wは、任意の単語文字に一致しますが、数字には句読点の一部が含まれます(&)。それは近いですが、正確には2期目にしたいことではありません。

最初の言葉では、数字を含めたくない場合は、文字がUnicodeの「文字」クラスであることを指定します。 \p{L}は、文字であるすべてのUnicode文字を指定します。

\s*[\p{L}][\p{L}_0-9]*\s

場合:これはので、私はこの正規表現は、あなたが何をしたいと思い

を[-ZA-Z]を含み、すべてのスウェーデンの文字、およびドイツ語、ロシア語、などdigits from other character setsと、さらにはother punctuationを含める場合は、[\w]*を第2期として使用できます。

関連する問題