私はこれを可能にする既存のツールについて知らないので、おそらくこのタスクを解決するためにあなた自身のスクリプトを書く必要があります。
これを実現するには、確かにSeleniumのようなライブラリを使用できます。それを使用すると、Webサイトのレンダリングに使用するブラウザを選択することさえできます。
Linuxで実行している場合は、私自身のプロジェクトwebkit-scrapingもお勧めします(この推奨事項は当然のことながら少し偏っています)。これは、メモリ内のWebkitインスタンスを使用してページをレンダリングし、その中にJavascriptを実行します。 cd webkit-server && qmake && make
でサーバーをコンパイルした後、あなたはPythonでこのような何か行うことができます。
import os, sys
sys.path.insert(0, '/path/to/webkit-scraping/lib')
import webkit_scraping
URL = 'http://example.org'
OUTFILE = '/tmp/example.html'
if __name__ == '__main__':
# set up a web scraping session
driver = webkit_scraping.webkit_server.Driver()
sess = webkit_scraping.scraping.Session(driver = driver)
sess.visit(URL)
with open(OUTFILE, 'wb') as f:
f.write(sess.body())
を私の知る限りでは、そのようなツールは、プログラムあなたは何語を好むん – Raghav
ことを行いませんがありますか?またはアプリケーションが必要ですか? – tryme
あなたの目標は何ですか?あなたのJSをデバッグするか、他の誰かのページのJSが何をしているのか見ていますか? –