2017-01-25 9 views
0

私は社内サイトにアクセスして毎時1時間のQTYデータを取得するプログラムを作っています。アクセスは問題ありませんが、データを取得しようとするのは混乱しやすい表形式なので、問題です。バックエンド経由でアクセスできません。BeautifulSoup&Selenium&troubleでテーブルを解析する

driver.get("companyurl") #fetching the site & feeding to beautifulsoup 
url = driver.page_source("companyurl") 
soup = BeautifulSoup(url) 
#this is where the issues start 

はTypeError:「ユニコード」オブジェクトが呼び出すことはできません(ライン2)

もスープとテーブル自体を取得する問題を抱えて、それはまた別のドルは

答えて

0

は、ページのソースを送信してみてください別の日ですセレンドライバは、解析のためにBeautifulSoupにストレート受信:

driver.get("companyurl") 
soup = BeautifulSoup(driver.page_source) 

その後、あなたのテーブルを検索してみてください:

all_tables = soup.find_all('table').get_text() 

それとも、それは配置を知っている場合:

a_table = soup.find_all('table')[1].get_text() 
+0

はPERFを働いていた、最終的なコード(数日後にそれを働いた)され 'driver.get( "会社のURL")' ' url = driver.page_source' 'soup = BeautifulSoup(url、" html.parser ")' – Rob

関連する問題