すべての画像とHTML内のリンクがない単一のWebページを複製したいとします。私はwget -E -H -k -K -p {url}
でこれを達成することができますが、これは完全な構造でWebページをプルダウンし、内容を表示するにはhtmlファイルに移動する必要があります。これにより、Webページを表示するhtmlファイルの場所が不一致になります。単一のWebページ(画像付き)をクローンしてindex.htmlに保存
私はこれもできますwget --no-check-certificate -O index.html -c -k {url}
これはイメージへのリンクを保持し、適切にページを表示するためにウェブに出なければならないので、ウェブページを本当にローカルにしません。
1つのWebページを複製し、画像がローカルにリンクされた状態でindex.htmlを吐出させる方法はありますか?
PS:Webページに変更を加えるpythonスクリプトを使用してwgetを使用しているため、index.htmlが必要です。より良いものがあれば、私は他の方法に興味があります。
EDIT:
だから、私はよく自分自身を説明していないようだが、このプロジェクトのビットの背景情報は、私がすることになっている自動化されたフィッシングスクリプトに学校のためのコンセプトの証明に取り組んでいますですいくつかのアクションタグを変更してローカルWebサーバーに配置して、ユーザーがそのページにナビゲートしてページが正しく表示されるようにします。以前は-Oを使用していましたが、DNSスプーフィングを自分のプロジェクトに組み込んで以来、内部Webサーバーにルーティングされるようになり、Webページが壊れてしまうようになるため、Webページには外部からのリンクがありません。そのため、私は単一のWebページが正しく表示されるために必要な情報だけを持っている必要があります。また、予測可能なので、私が複製したディレクトリに移動すると、WebページからWebサイトが表示されます画像への適切なリンク、CSS等。)
pythonスクリプトはどこですか? – Rahul