BlogからSeleniumまで動的コンテンツをスクラップしようとしていますが、レンダリングされていないJavaScriptが返されます。Seleniumによる動的コンテンツのスクラップ?
この動作をテストするために、iframeが完全に読み込まれ、それがうまく印刷されるコンテンツを印刷するまで待機しようとしましたが、親フレームに戻ると、レンダリングされていないJavaScriptが表示されます。
私は問題がある完全にレンダリングされたHTMLコンテンツ
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions
driver = webdriver.Chrome("path to chrome driver")
driver.get('http://justgivemechocolateandnobodygetshurt.blogspot.com/')
WebDriverWait(driver, 40).until(expected_conditions.frame_to_be_available_and_switch_to_it((By.ID, "navbar-iframe")))
# Rendered iframe HTML is printed.
content = driver.page_source
print content.encode("utf-8")
# When I switch back to parent frame it again prints non rendered JavaScript.
driver.switch_to.parent_frame()
content = driver.page_source
print content.encode("utf-8")
'.page_source'はソースを返すので、ないDOM – Fabricator
@Fabricatorにはどうすれば更新DOMを得ることができますか? –
@UmarIqbal、 'find_element'メソッドの1つを使って要素を選択しようとしましたか? – DuckPuncher