正則ロジスティック回帰(特にcv.glmnetを使って最適なラムダ値を見つける)に合った試行で、何が原因でエラーが発生しているのかを探しています。R glmnetエラーバイナリロジスティック
RegLR_CV<-cv.glmnet(x=train.sub.clean[,-c(431)],
y=as.factor(train.sub$finalAttrite),
family="binomial")
テーブルtrain.sub.clean
は、すべての数値であり、(caret
パッケージを使用して)すべてのゼロ分散変数を削除持っていた:
次のコマンドを実行します。
この関数はしばらく実行され、次のエラーが生成されます。誰でも私がトラブルシューティングのために探しているはずのものをお勧めできますか?パッケージ内のおもちゃの例として、私のデータセットでなければなりません。
Error:
Error in as.matrix(cbind2(1, newx) %*% nbeta) : error in evaluating the argument 'x' in selecting a method for function 'as.matrix': Error in t(.Call(Csparse_dense_crossprod, y, t(x))) : error in evaluating the argument 'x' in selecting a method for function 't': Error: invalid class 'NA' to dup_mMatrix_as_dgeMatrix
R: Rバージョン2.13.0(2011-04-13) プラットフォーム:x86_64の-PC-MINGW32/x64(64ビット)
glmnet:1.7
現在のバージョンRにアップグレードする必要があります。それでも問題が解決しない場合は、sessionInfo()の結果と問題を再現するデータを投稿してください。 –
'train.subclean [、 - c(431)]'を明示的に行列に変換するとどうなりますか?そこに「NA」がないことを確認できますか?また、ロジスティック回帰のクロスバリデーションも行っています。結果クラスの数が極端に少ないことはありますか?これにより、部分集合の1つに値の1つが含まれていないと考えられます。 –