2016-08-25 1 views
-2

美しいスープがXMLを解析できるように、file.csvの行からURLをインポートすることを検討していますが、次のようにする方法はありません。beautifulsoupのためにcsvの行からURLをインポート

url = row in 'file.csv' 
 

 
soup = BeautifulSoup(urllib2.urlopen('url').read() 
 

 
letters = soup.select('h1') 
 

 
print letters

+0

どのようにcsvファイルから読み込む? –

答えて

1

built-in csv moduleを使用します。

import csv 
import urllib2 

with open("input.csv", "rb") as f: 
    reader = csv.reader(f) 

    for row in reader: 
     url = row[0] 

     soup = BeautifulSoup(urllib2.urlopen(url)) 
     letters = soup.select('h1') 
     print url, letters 

このコードのように働くだろうあなたはすべての行の最初の「セル」のURLを持っているinput.csvファイルを既存している場合でありますたとえば、

関連する問題