2013-01-23 21 views
5

wgetを使用してウェブサイト/ディレクトリからすべての特定の拡張機能をダウンロードするためのエイリアス/スクリプトを作成しようとしていますが、私は何を思いつきましたか?WGETを使用してウェブサイト/ディレクトリからすべての.tar.gzファイルをダウンロードする

今私はGoogleの検索から作ってみたコードとmanページがある:

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/ 

だから、例の私はからすべての.tar.gzファイルをダウンロードしようとしている上OpenVZはテンプレートディレクトリを事前に作成しました。

上記のコードは正しく動作しますが、通常は作成される/ template/precreated /ディレクトリ構造を切り捨てる--cut-dirs = 2を手動で指定する必要があり、robots.txtファイルもダウンロードされます。

これは必ずしも問題ではなく、robots.txtファイルを削除するのは簡単ですが、マニュアルページでディレクトリ構造を指定しなくても同じことをすることができたと思っていました。切る...

お手数をおかけしていただきありがとうございます。

答えて

6

-Rを使用しますオプション

-R robots.txt,unwanted-file.txt 

不要なファイルのリスト(カンマ区切り)。このスクリプトについては

:あなたのURL内のサブディレクトリに基づいて動作するはず

URL=http://download.openvz.org/template/precreated/ 
CUTS=`echo ${URL#http://} | awk -F '/' '{print NF -2}'` 
wget -r -l1 -nH --cut-dirs=${CUTS} --no-parent -A.tar.gz --no-directories -R robots.txt ${URL} 

2

これは本当に迷惑であり、あなたがあなたのためだけにそれを削除するには、本当に短い2行のスクリプトを書くために、それを多くのことを行うことを抱えている場合、私は、お勧めします:

wget -r -l1 -nH --cut-dirs=2 --no-parent -A.tar.gz --no-directories http://download.openvz.org/template/precreated/ 
rm robots.txt 
+0

ええ、私はちょうどサイトのURLをフィードして残りのことをすることができるbashスクリプトを作成しようとしています...本質的にsh dl.sh tar.gzです。 .gz – sMyles

関連する問題