私は基本的なCrawlSpiderをscrapyで書いていますが、URLがクロールされる順番は何ですか?FIFO/LIFO?Scrollのクロールの順序
私は、クローラが開始URLページのすべてのリンクをクロールし、その後、注文と思われない他のURLに移動する必要があります。
どうすればいいですか?デフォルトでは
私は基本的なCrawlSpiderをscrapyで書いていますが、URLがクロールされる順番は何ですか?FIFO/LIFO?Scrollのクロールの順序
私は、クローラが開始URLページのすべてのリンクをクロールし、その後、注文と思われない他のURLに移動する必要があります。
どうすればいいですか?デフォルトでは
、Scrapyは、基本的にはDFOの順にクロールすることを意味する 、保留中の要求を格納するためLIFOキューを使用しています。ほとんどの場合、この順序はより便利です です。あなたはこのために見ていない
DEPTH_PRIORITY = 1
SCHEDULER_DISK_QUEUE = 'scrapy.squeue.PickleFifoDiskQueue'
SCHEDULER_MEMORY_QUEUE = 'scrapy.squeue.FifoMemoryQueue'
されています:あなたは、本当のBFOの順に をクロールしたい場合は、以下の設定を設定することにより、それを行うことができますhttp://stackoverflow.com/questions/6566322/ scrapy-crawl-urls-in-order? – warvariuc