ウェブページのクロールにscrapyを使用したいと思います。端末自体から開始URLを渡す方法はありますか?クロールのための治療にURLを指定するにはどうすればよいですか?
クモの名前またはURLのいずれかを指定することができますが、私は、URLが与えられたとき、それはエラーをスローすることをdocumentationに与えられている:私のクモの
//名前は一例ですが、私私のクモの名前の代わりにURLをつけています(クモの名前をつけるとうまくいきます)。
scrapy crawl example.com
ERROR:
File "/usr/local/lib/python2.7/dist-packages/Scrapy-0.14.1-py2.7.egg/scrapy/spidermanager.py", line 43, in create raise KeyError("Spider not found: %s" % spider_name) KeyError: 'Spider not found: example.com'
は、どのように私はscrapyは、端末に与えられたURLに私のクモを使用することができます?
example.comはスパイダーのallowed_domainsに追加されていますか? –
yes example.comがallowed_domainsに追加されます。私が本当に望むのは、コマンドラインからstart_urlを与えることです。どうすればいい? –