私はシンプルなWebスクレーパー(ここで新しいpythonプログラマー - 簡単な質問を許してください)を構築しようとしています。
ここ は私のコードです:なしwebscraperコード
import urllib2
from bs4 import BeautifulSoup
comments_url = 'https://somewebsite.com'
comments_page = urllib2.urlopen(comments_url)
raw_data = BeautifulSoup(comments_page, 'html.parser')
data = raw_data.find('tr',attrs={'data-ix-row': 'data-ix-bug'})
print(type(data))`
参考のために、ここで私は、ウェブページのうち、解析しようとしているクラスは、次のとおりです。 html_grab_reference page
私はこのコードを実行すると、私は次のエラーを取得します:
<type 'NoneType'>
私は質問したデータのどこかでミスを犯しました(私は思う)、それは何も戻っていません。
私が間違っていたことに関するアイデアはありますか?
。あなたが興味を持っているどのような値のための
data-ix-bug
をフィルタリング(そして、あなたはおそらく、find_all
したいと思います) ascriptを使用するとurllib2とbeautifulsoupを使用して構文解析することはできません –探していたものを見つけられませんでしたので
そして
–