2017-01-30 3 views
1

私は、テキスト以外のcsvとzipアドレスへのリンクがたくさんあるベクトルを持っていますが、Zipファイルを含むアドレスのみを抽出します。Rの正規表現を使用して同様の文字列内の文字列をグレープする

しかし、時には郵便番号やCSVファイルのアドレスは次のように同じ行にある:

ます。http:/something.csvます。http:

私は正規表現を使用することができますどのように

/something.zip Rは郵便番号のリンクのみを選ぶ?例えば、

のhttp:/ .. something.zip

私はパターンhttp(.*?)zipを試みた文全体が「HTTP」で始まるので、それは全体の文章を返すため、それは動作しません。 ?それはちょうど、以下で動作するはず

+1

のhttp \\ S *ジッパーが動作するはずです(キャピタルSでお知らせ) – G5W

+0

何 'リンク[グレップ(パターン= ".zipファイルの$" について、x =リンク)] '? – user2100721

+0

私はそれが解決するとは思わない:(。regmatches(vector、regexpr( "http [^ \\ s] *?zip"、vector))character(0)ここで "vector"はリンクのある文です。空白はありませんが、csvとzipのリンクの間にたくさんのテキストがあります – Rodrigo

答えて

1

links[grep(".zip", links)] 
+0

これは、リンクだけでなく、それがベクターにあるかどうか(私がすでに知っている)を見るだけでなく、しかし、助けてくれてありがとう... @ G5Wの答えは仕事をした... – Rodrigo