私は、Webページからプログラムにデータを取得する際に問題が発生した暇な時にプロジェクトをやっています。div-dataを印刷するにはどうすればいいですか?
これは私の現在のコードです:私はそれがこのreactid
でWebページ上のすべての値を表示させる、と私はできません
regex = r'<div data-reactid=".3.$squad content.0.$=11:0.0.0.0.1:0.2.0.0">([^<]*)</div>'
:
import urllib
import re
htmlfile = urllib.urlopen("http://www.superliga.dk/klub/aab?sub=squad")
htmltext = htmlfile.read()
regex = r'<div data-reactid=".3.$squad content.0.$=11:0.0.0.0.1:0.2.0.0">([^<]*)</div>'
pattern = re.compile(regex)
goal = re.findall(pattern,htmltext)
print goal
そして、それはこの部分を除いて大丈夫働いていますこの問題の解決策を見つけることはできません。 Pythonで印刷する方法を教えてください。
実際のhtmlパーサーを試しましたか? –
上記のどのようなクリケット。何らかのパーサーやスクレーパーで100倍簡単になります。例については、[このリンク](http://docs.python-guide.org/ja/latest/scenarios/scrape/)を参照してください。 – Dillanm