6
私はPythonのMechanizeモジュールを使っています。 Python Mechanizeはこれらのサイトを開けません
- :私は直接Mechanizeので開くことができない3異なるサイト間で来ています
http://www.cpsc.gov/cpscpub/prerel/prhtml03/03059.html
import mechanize br = mechanize.Browser() br.set_handle_robots(False)
次のコードを追加するWikipediaの記事とGoogle検索結果を開いて解析する機械化できS:
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
しかし、私の回避策はCPSC.govのウェブサイトのための一致ではない - 私はMechanizeのブラウザでそれを開こうとすると、私のpythonのフリーズ - 私もキーボードそれを中断することはできませんポイントに。
ここでは何が起こっていますか?
あなたは上司です! 私の質問に対する答えをどのように知っていたでしょうか? –
「urllib2.urlopen」と「mechanize.urlopen」でURLを開くことができたことに気付きました。その後、各オープナーのハンドラー( 'urllib2._opener'、' mechanize._opener'と 'mechanize.Browser()')を比較し、[HttpFox](https://addons.mozilla.org)のトレースを調べました/ en-US/firefox/addon/httpfox /)。数回試してみたところ、リフレッシュプロセッサを取り外すことが適切な解決策であることがわかった。 – jcollado
敬意。もう一度ありがとう:) –