これは、長さが289バイトで403 forbidden
ページのHTMLコードである可能性があります。これはサーバーがスマートなので、コードでユーザーエージェントが指定されていないと拒否されるためです。
Pythonの3
# python3
import urllib.request as request
url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'
# fake user agent of Safari
fake_useragent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
r = request.Request(url, headers={'User-Agent': fake_useragent})
f = request.urlopen(r)
# print or write
print(f.read())
のPython 2
# python2
import urllib2
url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'
# fake user agent of safari
fake_useragent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
r = urllib2.Request(url, headers={'User-Agent': fake_useragent})
f = urllib2.urlopen(r)
print(f.read())
要求とBeautifulSoupをお勧めします、両方の良いLIB。 – Jeon
答えをありがとう。私はディスクにファイルをダウンロードできるようにする必要があります(できれば上書きすることができますが)。 – Winterflags
これは例です。 'f.read()'を実行すると、別のファイルに書き込むことができます。ポイントは、偽のエージェントを使用してExcelファイルを取得することです。その後は、ファイル操作と同じです。 – Jeon