私は、データベースのGoogleのURLの中間をキャプチャするためのベース正規表現を把握しようとしています。URLの正規表現のキャプチャ
例えば、いくつかのリンク:
https://www.google.com/cars/?year=2016&model=かわす + デュランゴ & ID = 1234 https://www.google.com/cars/?year=2014&model=ジープ + チェロキー + クロスオーバー & ID = 6789
何だろう取得するテキストをキャプチャする正規表現になるdodge + du rango、またはジープ+チェロキー+クロスオーバー? (これは、+がまだそこにあることが大丈夫です。)
私の試み:
1) \b[=.]\W\b\w{5}\b[+.]?\w{7}
が、これはのみのために何かのように働くだろう、ハードコーディングされたシナリオであるとして、これは明らかに動作しません。デュランゴの例を避ける。
2)正ルックバックを使用して、
[^+](?=&id)
(「かわす+デュランゴを抽出します)が、これが唯一の1つの文字&記号の後ろにつかむように私は、これを使用するかどうかは完全にはわからない。
どのように私は(潜在的に)の文字列を抽出することができますが、regexp_replace
とアクセスマットを使用することができますように「モデル=」と「& ID」境界の間の+区切り文字のいずれかの量の任意の長さ?
使用しているdbmsにタグを付けてください。 –
が赤方偏移として追加されました。ありがとう –