2017-01-18 6 views
1

私は、作成されたデータフレームからリンクを取り、より多くの廃棄を続けるループを作成しようとしています。私は間違って何をしていますか?ループ内でソースリンクが読み込まれていますか?データフレームから情報を抽出するためのリンクを取得しようとしています

df = pd.DataFrame(columns = ['link'],data=[url.a.get('href') for url in soup.find_all('div',class_="link")]) 


for i in range(0,33): 
    link = df.iloc[i] 
    source1 = urllib.request.urlopen(link).read() 
    soup1 = bs.BeautifulSoup(source1,'lxml') 
    for username in soup1.find_all('div', class_="user-name"): 
     print(username.text) 
+0

私はまだあなたがpdを使用している理由を理解できませんか? –

+0

私はpdを使用してデータフレームへのリンクをすべて格納してからそれを参照します – Data1234

+0

パンダの使い方を学ぶためにリスト –

答えて

0

コードの問題の1つは、データフレームからのリンクを取得する方法です。それがなければならない:代わり

link = df.iloc[i] 

link = df.link.iloc[i] 

urlopen(link)stringを期待しながら、後者はobjectを返すため。エラーメッセージ/スタックトレースが提供されているかどうかをより正確に推測できます。

+0

あなたは正しいです!お手伝いありがとう – Data1234

関連する問題