私は複数の賭けサイトから賭けデータを集めるためにウェブクローラーを構築しようとしています。私はいくつかのプログラミング経験を持っていますが、ウェブページ、ウェブスクラップなどの世界では非常に迷っています。Python web scraping - どこから始める
以前は "ボット"を構築するためにSeleniumを使用していましたが、 (?おそらく、JavaScriptの)チュートリアル(urllib
、美しいスープ、など)が、すべてのそれらのチュートリアルは非常にシンプルなページをこすり、私が欲しいものは多少違うように見えるたとえば
、このページ:
https://sportsbet.io/sports/pre-live/category/kq9kajLnphopJwuwh
オッズなどのイベントはどうすれば入手できますか?
* "どこから始める" *は適切な質問ではありません。 – jonrsharpe
そのWebページは非常に複雑で、Js駆動されているようです。まずヘッドレスブラウザとブラウザの自動化でグーグルを見つけよう。セレンがウェブサイトによってブロックされる可能性があるので、あなたはファントムなどを使用する必要があります。 –
法的側面については言及していません:* "テキスト、ロゴ、グラフィックス、画像、ボタンアイコン、ソフトウェアを含む、ウェブサイト上のすべてのコンテンツは、SPORTSBETが所有またはライセンスしています。 /またはSPORTSBETが明示的に許可しない限り、ウェブサイトに掲載された素材の一部をダウンロードすることができます。 – jonrsharpe