2017-02-07 36 views
0

ADM financeからデータを削り取ろうとしています。私はrvestRのライブラリを使用してデータを取得しています。以下のコードは、私がR(rvest)を使用して財務ウェブサイトからデータをWebスクレイプ

library(rvest) 
url ="https://www.e-adm.com/futr/futr_composite_window.asp" 
table1 = html(url) %>% html_nodes(".miniText tr:nth-child(1) td:nth-child(1) .smTextBlk") %>% html_nodes("table") %>%html_table 
table2 = html(url) %>% html_nodes(".miniText tr:nth-child(1) td:nth-child(2) .smTextBlk") %>% html_nodes("table") %>%html_table 

を実行していると私の目標は、このウェブサイトからすべてのテーブルを引くためにあるデータなし

Warning message: 
'html' is deprecated. 
Use 'read_html' instead. 
See help("Deprecated") 

と、次の警告メッセージを取得しています。誰かがコードを手伝ってくれれば大きな助けになるだろう。前もって感謝します!

答えて

0
library(rvest) 
url ="https://www.e-adm.com/futr/futr_composite_window.asp" 

tableList <- read_html(url) %>% 
    html_nodes(".miniText") %>% 
    html_nodes("td table") %>% 
    html_table() 

これにより、リンクされたWebサイトに9つのテーブルのリストが作成されます。

+0

ありがとうございます。これは機能しています。なぜあなたは 'html_nodes()'関数を2回使ったのですか? – honey

+0

ほとんどの場合、整理のため、 'html_nodes("。miniText td table ")' – GGamba

関連する問題