JavaScriptを使用してデータを保護するウェブページからデータを削り取る必要があるため、ブラウザからページにアクセスしてソースコードを見ると、 Mozillaの "Analyze element"を実行したり、自分のコンピュータ上でそのページをダウンロードしてソースコードを調べると、必要なデータが暗号化されていないことがわかります。Python - ウェブページの解析ソースコードを取得
import requests
source = requests.get(url).text
が、私はまた、wgetコマンドを使用しようとした
未解析のソースコードを受け取ります:現時点では
私が使用しています
import wget
source = wget.download(url)
をそれがダウンロード「アクセスが拒否されたCloudflare」ページ。
Pythonで解析されたソースコードにアクセスするにはどうすればよいですか?
彼らは、あなたが(requests.get 'から取得したコンテンツを暗号化されていない)'の実際のソースでありますその特定のURLとの違いは、現代のブラウザはjavascriptのコンテンツを解析して、最終ページにレンダリングするように伝えられます(テーブルを作成し、余分なデータを読み込むなど)。 – Shane
@Shane説明をいただきありがとうございます。その後、解析されたソースコードを入手することは可能ですか? – Hyperion
確かに、Chromeのような実際のブラウザで "バックグラウンド"のリクエストがどのように機能しているかを調べ、そのリクエストをシミュレートする必要があります。 – Shane