私の次のコードは、各プレーヤーのデータを行単位でスクラップし、列の値をコンマで区切って管理しています。しかし、プレイヤー名には、別の行にも表示されている基本的な子供がいるようです。私は単純に、リンクではなく名前のテキストを求めます。また、いくつかのレコードが私の出力で繰り返されます。どんな助けでも大歓迎です!私はBS4とPython 3.5を使用しています。ここに私のコードは次のとおりです。うちBeautifulSup掻き出しの問題
import urllib
import urllib.request
from bs4 import BeautifulSoup
def make_soup(url):
page = urllib.request.urlopen(url)
soupdata = BeautifulSoup(page, "html.parser")
return soupdata
currentdata = ""
soup = make_soup("http://www.foxsports.com/soccer/stats? competition=1&season=20160&category=STANDARD&pos=0&team=0&isOpp=0&sort=3&sortOrder=0&page=0")
for record in soup.findAll('tr'):
playerdata = ""
for data in record.findAll('td'):
playerdata = playerdata + "," + data.text
currentdata = currentdata + "\n" + playerdata
print(currentdata)
あなたは[リクエスト](http://docs.python-requests.org/en/master/をチェックアウト、ウェブスクレイピングになっている場合。urllibはよりリクエストを使用することがはるかに簡単である。このことができます –