私は添付ファイルの画像とともにURLをHTMLとして取得する必要があります。 htmlはカスタムファイル名で保存されます(私はそれに呼び出しスクリプトでタイムスタンプを与えています)、画像にもこれらのタイムスタンプが必要です。本質的に、これは、HTML内のローカル相対パスのための画像のパスを書き換える必要があるミラーであるhtmlファイルをミラーリングする方法と、指定されたファイル名のwgetを使用して画像をローカルに添付する方法はありますか?
2012-02-22 06:00:00 UTC.html
2012-02-22 07:00:00 UTC.html
2012-02-22 08:00:00 UTC.html
img1_2012-02-22 06:00:00 UTC.gif
img2_2012-02-22 06:00:00 UTC.gif
img1_2012-02-22 07:00:00 UTC.gif
img2_2012-02-22 07:00:00 UTC.gif
img1_2012-02-22 08:00:00 UTC.gif
img2_2012-02-22 08:00:00 UTC.gif
:
得られたフォルダは次のように構成されるべきであるべきです。私はwgetの--directory-prefix
と--output-document
を使って遊んだことがありますが、実際には成功していません。なぜなら、イメージはhtml出力ファイルに埋め込まれているからです。
これは株式wgetで実行可能ですか、それとも、各ファイルをプルダウンして、文字列を適切に置き換えるhtmlファイルを解析するだけの独自のスクリプトを作成する方が良いですか?
おかげさまで、あなたは本質的に私が傾けていたことをやってきました。明らかに私のシナリオとまったく同じではないが、近い。私はwgetやそれに類するものが十分に柔軟であるとは思わないし、すべてのカスタマイズを完了し、ファイル名のHTML出力を吟味するときには、スクリプトを作成してすべてを取り出す方が良いあなたが最初に望むようにそれを保管してください。さらに、フルコントロールの利点もあります。 – ylluminate