2016-09-26 6 views
2

私は問題に直面しました。しかしない私にとって、フェールセーフwget htmlスクリプト? (ユーザーが〜 .wgetrcを使用している場合)

# Determine the latest version by checking the web page: 
VERSION=${VERSION:-"$(wget -O - http://www.adobe.com/software/flash/about/ 2>/dev/null | sed -n "/Firefox - NPAPI/{N;p}" | tr -d ' '| tail -1 | tr '<>' ' ' | cut -f3 -d ' ')"} 
echo "Latest version = "$VERSION 

このコードは、それ自体は通常、魔法のように動作します:それは、彼はadobe.comに最新Adobeflashバージョンを確認するために使用するalienbobのスクリプトの1からコードスニペットについてでした。私はカスタム~\.wgetrcを使用しています。なぜなら、wgetが単一のダウンロードをすることを許可しなかったページで問題が発生したからです。通常、私は、サイトがそのようなことを許可しない限り、どのサイトにも大量のダウンロードをしません。あるいは私のwgetスクリプトに1つの1つのライナーを合理的な休止を設定します。とりわけ今

~\.wgetrcセットアップマスクWindowsのFirefoxなどの私のwgetの、そしてまた、この行が含まれています

header = Accept-Encoding: gzip,deflate 

ことを意味し、私はhtmlファイルをダウンロードするためにwgetコマンドを使用する場合、それはダウンロードそのファイルをgipped htmlとします。

私は、このようなユーザー設定でalienbobのようなスクリプトを作ったり、ユーザーがその設定で自分のシステムを台無しにしてしまったこと、そしてスクリプト自体がなぜ誤動作?

(それが必要としてwgetのを使用した場合、1は通常のhtmlファイルをgzipで圧縮することを望んではないので、私の場合、私はちょうど、header = Accept-Encoding行を削除し、すべての作品でした)

答えて

0

使用

wget --header=Accept-Encoding:identity -O - .... 
ヘッダーオプションとして

が同じ名前の.wgetrcオプションよりも優先されます。

はたぶん、対象ページが再設計された、これは今、私の作品のwgetの一部です:

wget --header=Accept-Encoding:identity -O - http://www.adobe.com/software/flash/about/ 2>/dev/null | fgrep -m 1 -A 2 "Firefox - NPAPI" | tail -1 | sed s/\</\>/g | cut -d\> -f3 
関連する問題