2011-08-17 35 views
5

Webページを読み込んでコマンドラインを使用して保存したいと考えています(firefoxやchromeの完全なページと同じような動作をしたいと思います)。 )htmlページをレンダリングしてコマンドラインを使用して保存する

私はwgetとhttrackを使ってみましたが、彼らは私に正しくhtmlファイルを与えてくれました。しかし、不正な形式のHTMLの場合、ブラウザはレンダリング中にそれを修正し、そこに保存して使用すると修正されたHTMLが得られますが、これはwgetやhtttrackの場合に起こりません。

ページをレンダリングし、ページをすべての画像やフラッシュ、その他すべてのものと共にローカルに保存するツールはありますか?

+0

Firefoxはコマンドラインから使用できます。しかし、私はページを保存するためのオプションを得ることができません。何か案は...? –

答えて

2

オフラインで使用するためにページを保存するときは、「スクラップブック」というFirefoxプラグインを使用します。それはもちろん、あなたのコマンドラインの要件を許可していません。しかし、 'htmlunit'などのツールを使用すると、Firefoxブラウザを起動して保存したいページに移動することができます。

0

まさにその利用できるいくつかの洗練されたソフトウェアがあります: https://launchpad.net/shotfactory

+0

これは、私が探しているものではないスクリーンショットをキャプチャするために使用されています –

1

あなたはTidyのは、無効なHTMLマークアップを変換することができるはずつまり

curl http://stackoverflow.com > page.html 
    tidy page.html > page_clean.html 

tidyhtmlとの組み合わせでcurlやwgetコマンドを使用することができます有効なXTMLに

+0

でも、それは私を助けません.. –

1

ファイアウォールでページを開き、保存ボタンをクリックして保存することができませんでした。ファイアウォールとxdotoolsを使用してタスク全体を自動化するスクリプトを作成しました。

すべてのヘルプとビューのお友達に感謝します。

1

今日、私は同じようなものの必要性を感じました(そしてxdotoolパスに行った)。私のバージョン(再利用可能なbashスクリプト)は次の場所にあります。https://github.com/abiyani/automate-save-page-as

関連する問題