私は、テキスト以外のcsvとzipアドレスへのリンクがたくさんあるベクトルを持っていますが、Zipファイルを含むアドレスのみを抽出します。Rの正規表現を使用して同様の文字列内の文字列をグレープする
しかし、時には郵便番号やCSVファイルのアドレスは次のように同じ行にある:
私は正規表現を使用することができますどのようにます。http:/something.csvます。http:
/something.zip Rは郵便番号のリンクのみを選ぶ?例えば、
のhttp:/ .. something.zip
私はパターンhttp(.*?)zip
を試みた文全体が「HTTP」で始まるので、それは全体の文章を返すため、それは動作しません。 ?それはちょうど、以下で動作するはず
のhttp \\ S *ジッパーが動作するはずです(キャピタルSでお知らせ) – G5W
何 'リンク[グレップ(パターン= ".zipファイルの$" について、x =リンク)] '? – user2100721
私はそれが解決するとは思わない:(。regmatches(vector、regexpr( "http [^ \\ s] *?zip"、vector))character(0)ここで "vector"はリンクのある文です。空白はありませんが、csvとzipのリンクの間にたくさんのテキストがあります – Rodrigo