2016-03-23 10 views
0

私はgoogle.comから特定のURLをクロールしていますが、私はいくつかのエラーPythonのUTF8 "コーデックは72位で、バイト0xc3をデコードすることはできません:無効な継続バイト

'utf8' codec can't decode byte 0xc3 in position 72: invalid continuation byte 

コードを取得:

import re 
import os 
import MySQLdb 
import codecs 
import requests 
import base64 
import random 
import gzip 
import time 
from multiprocessing.pool import Pool 
import datetime 
import time 

import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 
def proxy_mesh(): 
    while True: 
     try: 

      data = requests.get('google.com') 

      print data.text.encode('utf-8') 
     except Exception, e: 
      print e 
      print "Trying again" 
      time.sleep(3) 
proxy_mesh() 

FIXとは何ですか?このエラーはどのように起こりますか?

+0

、エンコーディングが異なって行われていた間、あなたは 'UTF-8'を使用して解読しようとしています。 – Leb

+0

暑いですか? @Leb – Mounarajan

+0

トレースバックできますか?これは暗黙のうちにいくつかの場所で発生している可能性があります。 – ShadowRanger

答えて

0

簡単に保つと機能します。データは既にrequestsモジュールによってデコードされています。

import requests 
data = requests.get('https://www.whoisxmlapi.com/whoisserver/WhoisService?domainName=http://N%E2%94%[email protected]&outputFormat=json') 
print data.text 

それはJSON応答であるので、あなたもそれを処理することもできます。つまり

import json 
print json.loads(data.text) 
関連する問題