のPerlの正規表現の単語境界等価

私は正規表現のPerlの正規表現の単語境界等価

\ba

が

(?<!\w)a

と同等ですが、その前に、私は多分

^a|\Wa

があまりにも同等であることを考え出していたことを読んで

質問：Wha tはそれらの2つの違いですか？誰かが等価でない場合は、例を書くことができますか？

出典

2016-11-30 Zalán Vajda

'（？<！\ w）'は単語の先頭にのみ一致し、 '\ b'は単語の両端にアサートされます。 – dawg

@dawgはいですが、 'a'は単語文字です。つまり、' \ ba'では '\ b'は非単語が左側にある場合のみで満足できます。 – hobbs

\bので

\baが(?:(?<!\w)(?=\w)|(?<=\w)(?!\w))aと同等であるので、

\baが(?<!\w)aaためマッチ\wに相当し、(?:(?<!\w)(?=\w)|(?<=\w)(?!\w))と等価です。

両方\baと(?<!\w)aは時折交換可能であるという点に両方^a|\Waと(?:^|\W)aに類似しているが、前者の二つの単一文字に一致し、後者の二つは、2つに一致することができるので、それらが異なっています。比較：これは、彼らは同じではありませんなぜ私が提供できる最短一例である!a

と一致します!a ^a|\Waながら

say '[email protected]#$' =~ s/\ba//r;   # [email protected]#$ 

say '[email protected]#$' =~ s/(?<!\w)a//r; # [email protected]#$ 

say '[email protected]#$' =~ s/^a|\Wa//r;  # !#$ 

say '[email protected]#$' =~ s/(?:^|\W)a//r; # !#$

出典

2016-11-30 19:59:10 ikegami

別の例： 'say for '!! a !!' =〜/（！| \ ba）/ g; ' – ikegami

私は部分文字列を扱いませんが、文字列全体が一致するだけの場合、私の"解決策 "は大丈夫ですか？どう思いますか？私は、L（正規表現）セットだけを認識するNFAを書いています。 –

いいえ、 "a" =〜/^[x！]（？：\ ba | b）\ z /？ "一致"： "一致しませんでした"; （これは '\ b'なしでパターンを書き換えることは不可能ではありません。） – ikegami

\baは、文字列のaと一致します。

出典

2016-11-30 21:52:40

'！'は非単語文字なので、間違っていると思います。正規表現 '\ Wa'は文字列'！a'と一致します。 –

あなたは正しいです、私はそれを後ろに書きました。 –

のPerlの正規表現の単語境界等価

答えて

関連する問題