私はこの同じテクニックを使用する前にウェブサイトを削ってきました。しかし、このウェブサイトではうまくいかないようです。美味しいスープでこする問題
の任意のアイデア(それはまた、いくつかの私はここにコピーすることはできませんシンボルを次の)
GIF89aの:出力で
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.weatheronline.co.uk/weather/maps/current?LANG=en&DATE=1354104000&CONT=euro&LAND=UK&KEY=UK&SORT=1&INT=06&TYP=sonne&ART=tabelle&RUBRIK=akt&R=310&CEL=C"
page=urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
print soup
は、ウェブページの内容でなければなりませんが、代わりに私はこれを取得しています何が問題なのか、どのように進めるべきか。
@Abhijitあなたがサイトを削っていると分かるとすぐに、彼らはあなたの掻き取りを壊すHTMLを変更するかもしれないことに注意してください。またはIPアドレスをブロックします。またはその他の変更。彼らはあなたが自分のサイトを掻き回すことを望んでいません。多分あなたはそれを尊重すべきです。 –
@Abhijit: – John
トレースバック(最新の呼び出しの最後): "C:\ Python27 \ libに\ urllib2.py" ファイルで ファイル ""、ライン1、応答= opener.open(URL)がエラーを返し、 レスポンス= ファイル "C:\ Python27 \ lib \ urllib2.py"、行519、http_response 'http'、リクエスト、レスポンス、コード、msg、hdrs) ファイル "C:¥Python27¥lib¥urllib2.py"、行444、エラー return self._call_chain(* args) ファイルhttp:// error.default内の "C:\ Python27 \ lib \ urllib2.py"ファイル527行、 HTTPError(req.get_full_url()、code、msg、hdrs、fp) HTTPError:HTTPエラー4 03:禁止 –
John