複数のURL - BeautifulSoupスクレイピング

-1

私は私のscript.py複数のURL - BeautifulSoupスクレイピング

urls.txtと同じディレクトリにあるテキストファイルurls.txtを持つ複数のURLのリストを1行に1つずつ持っています。私は一発ですべてのURLをこすり特にdiv

このdivの内容を引き出すしようとしています

は、各URLここ

に複数回発生することは私のスクリプトです

import requests 
from bs4 import BeautifulSoup 
from urllib import urlopen 

with open('urls.txt') as inf: 
    urls = (line.strip() for line in inf) 
    for url in urls: 
     site = urlopen(url) 
     soup = BeautifulSoup(site, "lxml") 
     for item in soup.find_all("div", {"class": "vm-product-descr-container-1"}): 
      print item.text

urls.txtのすべてのURLからコンテンツを返す代わりに、スクリプトはリスト内の最後のURLのコンテンツのみを返します。

私のスクリプトはエラーを返さないため、どこが間違っているのかわかりません。

ありがとうございます。

出典

2016-08-16 RobBenz

@danideeあなたは自分のコードからエラーを編集したばかりです^^ –

@RobBenz、あなたの受け入れられた答えは実際にあなたの質問に答えてくれます。 –

は小さなインデントエラーのように思える：このブロックでルック：この1へ

for url in urls: 
    site = urlopen(url) 
    soup = BeautifulSoup(site, "lxml") 
    for item in soup.find_all("div", {"class": "vm-product-descr-container-1"}): 
    print item.text

変更して：印刷がために内部で反復ごとに実行されます

for url in urls: 
    site = urlopen(url) 
    soup = BeautifulSoup(site, "lxml") 
    for item in soup.find_all("div", {"class": "vm-product-descr-container-1"}): 
     print item.text

この方法ループ。

出典

2016-08-16 17:30:46

いいえ、あなたはあなたの答えに字下がりのエラーがあります – danidee

私はちょうど今私の答えを編集.. –

複数のURL - BeautifulSoupスクレイピング

答えて

関連する問題