2016-05-19 4 views
1

Protein Data Bankから.pdbファイルをダウンロードしようとしています。私はこれらのファイルを抽出するために以下のコードブロックを書いていますが、ダウンロードされているファイルにはWebページが含まれています。Pythonを使用してProtein Data Bankから特定の.pdbファイルをダウンロードする

#Sector C - Processing block: 
RefinedPDBCodeList = [] #C1 
with open('RefinedPDBCodeList') as inputfile: 
    for line in inputfile: 
     RefinedPDBCodeList.append(line.strip().split(',')) 

print(RefinedPDBCodeList[0]) 
['101m.pdb'] 

import urllib.request  
for i in range(0, 1): #S2 - range(0, len(RefinedPDBCodeList)): 
    path=urllib.request.urlretrieve('http://www.rcsb.org/pdb/explore/explore.do?structureId=101m', '101m.pdb') 

答えて

3

あなたは間違ったベースURLを持っているようです。代わりに試してみてください:

urllib.request.urlretrieve('http://files.rcsb.org/download/101M.pdb', '101m.pdb') 
+0

ああ、愚かな私。魅力のように動作します。 – David

0

(旧URLは今のところ、新しいものにリダイレクトが)URLが以降に更新されました:

urllib.request.urlretrieve('https://files.rcsb.org/download/101M.pdb', '101m.pdb') 

は異なるダウンロード用URLの完全なリストについては、https://www.rcsb.org/pdb/static.do?p=download/http/index.htmlを参照してください。 RCSB PDBから入手可能である。

関連する問題