変更が発生したときにサイトを監視するソフトウェアをPythonで作成する必要があります。現時点で私は定期的なタスクを持っており、以前のバージョンとサイトの内容をチェックします。サイトのコンテンツが変更されたか、最後に変更されたかどうかを確認する簡単な方法はありますか?サイトの最新の変更を取得
0
A
答えて
4
HEAD
HTTPメソッドを使用して、実際にコンテンツ全体を再度ダウンロードする前に、Date-Modified
とETag
ヘッダーなどを見ることができます。
しかし、エンティティの(URLの)コンテンツが変更された場合、または実際にはHEAD
メソッドに正しく応答する場合でも、サーバーがこれらのヘッダーを実際に更新することは保証されません。
1
あなたの質問に答えることはできません私は、変更を探すために以前のバージョンのウェブサイトを保存する必要はありません。あなたはちょうどmd5
を数えてこの合計を保存し、それから新しいバージョンを数え、それらが等しいかどうかをチェックすることができます。
質問自体については、AKXが大きな回答をくれました。ちょうどDate-Modified
ヘッダーを探しますが、動作することは保証されていません。
関連する問題
- 1. CVS - 最新の変更のみを取得
- 2. URLの最終更新日を取得
- 3. 最終更新レコードの取得
- 4. 最新のレコードを取得
- 5. linuxのファイルの最終更新時刻を取得する
- 6. ファイルの最終更新日をVB6で取得
- 7. 最終更新日時のフォルダ(またはサブファイル/フォルダ)を取得
- 8. SharePointリスト(SPList)の最終更新日を取得する方法
- 9. Javaでファイルの最終更新日を取得する
- 10. SQLテーブルの最終更新行を取得
- 11. dojoデータストア/ JsonRestStoreから取得したオブジェクトの更新/変更
- 12. ユーザーの最新のSoundCloudトラックリンクを取得
- 13. MySQL:最終更新の変更方法
- 14. サイズ変更後のGridsterウィジェットの新しいサイズを取得
- 15. 最新のファイルをディレクトリに取得
- 16. 最新のS3キーを先に取得
- 17. SQL、最新の関連レコードを取得
- 18. MySQL:最新のレコードを取得
- 19. C#:ディレクトリから最新の(最後に変更された)5個のファイルを取得します。
- 20. テーブル更新時に変更者を取得
- 21. GACのアセンブリの最終変更日の取得
- 22. GITでファイルの最終変更を取得
- 23. ibatisのバッチ挿入/更新の更新カウントの取得
- 24. ディレクトリの最終変更時刻の取得
- 25. Groovy HTTPBuilderが最終更新日時を取得
- 26. SSAS/MDX/ADOMD.NET - キューブから最終更新日を取得する
- 27. HDFSで最後に更新されたファイルを取得
- 28. Antタスク最終更新日時を取得
- 29. 状況更新履歴の取得時の変更点を破る
- 30. リアルタイム更新後のデータの取得
ありがとうございます。私は現時点でハッシュを使用していますが、古いものと比較するために新しいハッシュを提供するためにコンテンツをダウンロードする必要がありますが、コンテンツが長くなり、サイトを離れて監視しています。 – Damir