以下のコードで何が問題なのですか?それは1日だけからデータを取得します。しかし、ウェブページは動的ウェブデータベースであり、何年ものデータを含んでいる。私は、2013年から2016年まで毎月のデータを掻き集めて、CSVファイルに保存する必要があります。Pythonでの動的Webデータベースの削り取り
import calendar
import requests
from bs4 import BeautifulSoup
cal = calendar.Calendar()
base_url = 'http://www.pse.pl/index.php?modul=21&id_rap=24&data=2016'
month_url = '&Month='
day_url = '&Day='
for year in range(2015, 2017):
for month in range(1, 13):
monthdays = [d for d in cal.itermonthdays(year, month) if d != 0]
for day in monthdays:
r = requests.get(base_url + str(year) + month_url + str(month) + day_url + str(day))
soup = BeautifulSoup(r.text,'lxml')
findtable = soup.find('table',{'id':'tabela'})
for i in findtable.findAll('tr'):
for j in i.findAll('td'):
print (j.text)
ありがとうございました。私は自分のコードを変更したのが好きです。私はそれがどのように機能するのか理解していると思います私は、あなたがおそらく解決する方法を知っているかもしれないさらなる問題の下に加えました。 – taumar
@taumar:これは別の質問としてお願いします。 (あなたがそうする時に私に知らせてください。他に誰もいなければ私は答えを提供します)。おそらく、ここの本当のパンダの専門家はあなたよりもずっと良い答えを私に与えることができます。 –