2012-01-07 11 views
8

一時的に404エラーが発生するサイトがあります。しかし、私はそれが動作するブラウザに貼り付ける。 404ステータスコードのリンクを5回再試行するように指示する方法。404のリンクがスクレイピーに見つかりませんでしたか?

+0

に設定たぶんあなたは、治療やサイトを使ってあまりにも多くのリクエストをしているだけかもしれない404 returninig? – adt

+0

1秒間に1つのリクエストを試しても、失敗することがあります。治療中に404状態を再試行する方法はありますか? –

答えて

14

2つのScrapyの設定が必要なものに関係があります。

  • RETRY_HTTP_CODES:あなたは404
  • RETRY_TIMESが含まれるように、プロジェクトのデフォルト値をオーバーライドする必要があります。ただ5
関連する問題