2017-02-03 11 views
1

エラーRのhtmltabを使用して: `* TMP *`でエラーが発生しました[[インデックス]:範囲外の添字

x <- htmltab(doc = "https://www.google.com/finance/historical?q=INDEXSP%3A.INX&ei=Qu-TWOn-AtW1mQGQ06WYCQ") 

を使用して、Google金融からINXをダウンロードしようとしていますし、それがこのエラーを与える:

Error in `*tmp*`[[index]] : subscript out of bounds 
+2

コードはどこですか? See [ask] –

+0

編集あり、ありがとう –

+0

何が 'htmltab'ですか?どの図書館から来たのですか? – SymbolixAU

答えて

0

私は仕事にhtmltabを取得できませんでしたが、あなたはlibrary(rvest)を使用して、テーブルの特定のxpathを指定したWebページを解析することができます

library(rvest) 

url <- "https://www.google.com/finance/historical?q=INDEXSP%3A.INX&ei=Qu-TWOn-AtW1mQGQ06WYCQ" 

read_html(url) %>% 
    html_node(xpath = "//*[@class='gf-table historical_price']") %>% 
    html_table() 

#   Date  Open  High  Low Close  Volume 
# 1 Feb 2, 2017 2,276.69 2,283.97 2,271.65 2,280.85 2,321,960,100 
# 2 Feb 1, 2017 2,285.59 2,289.14 2,272.44 2,279.55 2,478,979,663 
# 3 Jan 31, 2017 2,274.02 2,279.09 2,267.21 2,278.87 2,555,320,206 
# 4 Jan 30, 2017 2,286.01 2,286.01 2,268.04 2,280.90 2,108,083,825 
# ... 
関連する問題