3
私のアプリケーションは、RSS/Atomフィードを追跡し、新しいエントリをデータベースに保存する必要があります。私の質問はです。フィード内のエントリが既にクロールされているかどうかを判断する最も信頼できる方法は何ですか?フィードをクロールする方法
私はUniversal Feed Parserモジュールを使用してフィードを解析します。現在の実装では、feed.entry[i].updated_parsed
という最新の値の記録を保持しています。エントリの値がupdated_parsed
の場合にクロールすると、その値がデータベースに保存されます。ここで問題となるのは、多くのフィードに公開日または更新日がないことです。