これは私のコードです、皆さんもテストしてみることができます。私はいつもページソースの代わりに乱れた文字を取得します。urllib2を使用してURLを開いているうちに乱雑な文字が表示されるのはなぜですか?
通常Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}
Req = urllib2.Request("http://rlslog.net", None, Header)
Response = urllib2.urlopen(Req)
Html = Response.read()
print Html[:1000]
Html
は、ページのソースでなければなりませんが、それはめちゃめちゃアップ文字のトンとなりました。なぜ誰が知っていますか?
はところで:私はあなたがハエの圧縮をサポートしているユーザーエージェントを使用して要求を行うのpython 2.7
問題は私にとってうまくいきます。たぶん、あなたが応答を出力する方法でいくつかの単純な間違い? – Kapep
@kapep:本当ですか?私は単に「Html [:100]」を印刷するだけで、彼らはすべて台無しです。あなたは何のpythonバージョンですか? – Shane
印刷部分が含まれていないので、それは野生の推測でした。私のために期待どおりに動作します。 2.6.4を使う。 – Kapep