6

プログラムでWebページを保存したいと思います。プログラムでWebページを保存するにはどうすればよいですか?

単にHTMLを保存するという意味ではありません。私は自動的にすべての関連ファイル(画像、CSSファイル、おそらく埋め込まれたSWFなど)を保存し、ローカルブラウジング用のリンクを書き直したいと思います。

個人用のブックマークアプリケーションで、リンク元のコピーが取り込まれた場合にリンクコンテンツがキャッシュされます。

wget -p http://<site>/1.html 

がpage.htmlをダウンロードし、それが必要とするすべてのファイルになります。

答えて

6

−p −−page−requisites 
This option causes Wget to download all the files 
that are necessary to properly display 
a givenHTML page. Thisincludes such 
things as inlined images, sounds, and 
referenced stylesheets. 

特に-pフラグは、次のコマンドをwgetを見てみましょう。

+0

なぜ誰かが私を落胆させたのですか?私は-1が私の答えであるかもしれない問題を修正したいと思うほど私を悩ませないことを意味する。 – Josh

+0

時々出力がページと同じに見えないことを除いて、これはかなり良いように見える私はコピーした。例えば、私は 'wget -p'にしようとしました。http://ffffound.com/image/3d3795b5447291980a40f3719dea4b5b15ff3ec9 しかし、水平リストとしてレイアウトされた関連画像は、1行に1つの長い垂直リストになりました。どうして? –

2

Windowsの場合:IEをcomオブジェクトとして実行し、すべてを取り出すことができます。

他にも、Mozillaのソースを利用することができます。

Javaの場合、Lobo

またはcommons-httpclientと多くのコードを書いてください。

+0

+1スタイルシートやCSSのインポートで参照される背景画像のようなものが必要な場合は、実際のHTMLとCSSのパーサが必要です。これは既に半分のブラウザなので、実際のブラウザで行うこともできます。最も簡単にIEを埋め込むか、Firefoxの拡張機能として動作します。 – bobince

0

MHTML形式(IEの使用する形式)を試すことができます。 http://en.wikipedia.org/wiki/MHTML

つまり、各オブジェクト(イメージ、CSSなど)をコンピュータにダウンロードしてから、Base64を使用して1つのファイルに埋め込むことになります。

+0

どうすればプログラムできますか? –

+0

どのようなプログラミング言語を使いたいですか? –

+0

VBを使用しているものは次のとおりです。http://www.codeproject.com/KB/aspnet/aspnethtml2mht.aspx –

関連する問題