私は25000行と761列のデータセットを持っています。これにはバイナリ応答カラムが1つあります。私のバイナリレスポンスは値が '-1'と '1'でした。私は、私はまだ同じエラーを取得しておく、次のコマンド -XGBoost in R
levels(output)[levels(output)=="-1"] <- "0"
を使用して、私の応答のレベルを変更し、それにxgboost実行しようとしている、と
xg_base<-xgboost(data = features,label = output,objective="binary:logistic",eta=1,nthreads=2,nrounds = 10
, verbose = T, print.every.n = 5)
Error in xgb.iter.update(bst$handle, dtrain, i - 1, obj) :
label must be in [0,1] for logistic regression
をsays-エラーを取得しておくました正確に何が問題なのかは分かりません。 1つの重要な点は、これがまれな事象検出問題であり、陽性事例の割合が全観測値の1%であることである。それが私がエラーを取得している理由ですか?
私は 'output'変数は0と1の間でなければならないと考えています。 'xgboost'を使うときにレスポンスをコード化する必要があるかもしれません。 – steveb