ウェブアドレスのホスト名部分を無視して、パスのみを保持しようとしています。例えばホスト名を無視するための正規表現
:
http://bar.foooo.com/path1/path2/path3
は現在、私は、次の正規表現を持っている:
\\bhttp\\b)*(\\bhttps\\b)*(\\b[\\w']{1,2}\\b)*(\\bwww\\b)*(\\bco\\b)*(\\buk\\b)*(\\bcom\\b)*(\\borg\\b)*[^\\p{L}\\p{N}]+|[\\w\\d']{20,}|\\b\\w*\\d\\w*", " "));
にそのリンクを向く:
bar foooo path1 path2 path3
が、私にはバーやfooooを除外したいです言い換えれば[http://bar.foooo.com/]を無視する
正規表現が正しくありません。使用する言語を指定する必要があります。 – Armali