あるスパイダーのスクラップしたURLを別のスパイダーのstart_urls
に送るにはどうすればいいですか?あるスパイダーから別のスパイダーに擦ったURLを渡す
具体的には、XMLページからURLのリストを取得するスパイダーを1つ実行します。 URLを取得した後、別のスパイダーが掻き集めるために使用します。
from scrapy.spiders import SitemapSpider
class Daily(SitemapSpider):
name = 'daily'
sitemap_urls = ['http://example.com/sitemap.xml']
def parse(self, response):
print response.url
# How do I send these URL's to another spider instead?
yield {
'url': response.url
}
これをすべて1つのスパイダーで行うことは、もっと理にかなっています。 2つのスパイダーを使用する理由は何ですか? –