2016-07-17 4 views
0

私は大きなデータセットを持っており、Rのパッケージxgboostを使用して回帰を実行しようとしています。R xgboost - ローカルデータファイルの使い方は?

機能xgboostは、引数dataが、私はそれが使用するファイルの名前である必要があります理解し、そこからローカルデータファイル、できることを言います。しかし、これ以上の仕様はないので、私の質問はどのくらい正確にこのファイルにする必要があります。

私は

random=matrix(rnorm(15),5,3) 
colnames(random)=c("first","second","label") 
write.csv(random,"random.csv") 
bst <- xgboost(data = "random.csv", 
       nthread = 7, 
       nround = 3, 
       objective="reg:linear", 
       verbose=FALSE) 

を試みたが、それは

6x0 matrix with 0 entries is loaded from random.csv 
Error in xgb.iter.update(bst$handle, dtrain, i - 1, obj) : 
NumCol:need column access 

感謝を返します!

答えて

1

xgboostローカルデータファイル入力はcsvをサポートしていないだろうので、私は後で私の答えを削除します。これから引用するlink

現在、XGBoostはローカルデータファイルをlibsvm形式でサポートしています。 - 詳細はhttp://blog.nycdatascience.com/uncategorized/xgboost-introduction/#sthash.bmlHst0T.dpuf

libsvm形式の詳細については、this Cross Validated Question/Answerを参照してください。

これが役に立ちます。

0

悲しいことに、私はまだコメントすることができません。これは適切な答えのために少し素朴ですが、確かに: - Rが正しいフォルダにあることを確認しましたか? getwd()を使用して、お探しの作業ディレクトリを確認し、setwd()を変更してください。

私はそれが不完全であること、

挨拶、

ダニエル

関連する問題