2016-09-05 7 views
0

私は文章の数値感情値を予測したい言語データを回帰しています。私のデータは120x531です。私はデータが比較的疎であるように、いわゆるバッグオブワードアプローチを使用しています。RのCaretパッケージは線形モデル(lm)とランダムなフォレストを混同します

私は私のコードは、基本的にこれであるので、単純な線形回帰モデルを始めたい:

ctrl = trainControl(method="cv", number=10) 
model.valence.lm = train(data[,5:531], data[,2], model = "lm", trControl = ctrl) 
model.valence.lm 

しかし、キャレットは、私は次の出力を得るように、(特に参照線形モデルとランダム森林を混同しているようです最初の行):これはさらに混乱私のために、私は基本的にコピーされ、以前のプロジェクトからこのコードを貼り付けるという、事実である作る何

Random Forest 

120 samples 
527 predictors 

No pre-processing 
Resampling: Cross-Validated (10 fold) 
Summary of sample sizes: 108, 108, 108, 108, 108, 108, ... 
Resampling results across tuning parameters: 

    mtry RMSE  Rsquared RMSE SD Rsquared SD 
    2 2.594079 0.2786009 0.1236510 0.1612251 
    32 2.459950 0.1920956 0.1886138 0.1484976 
    526 2.639718 0.1028518 0.2459268 0.1067835 

RMSE was used to select the optimal model using the smallest value. 
The final value used for the model was mtry = 32. 

(これは働いていました)。なぜこのようなことが起こるのか誰にも分かりますか?私は私のデータオブジェクトをチェックして、明らかに私が使っている機能は整数(浮動小数点数ではない)です。これは可能な説明かもしれませんか?

答えて

1

ランダムフォレストまたは "rf"は、methodパラメータのデフォルト引数です。 modelパラメータを設定しました。このパラメータは、クレームなしで受け入れても無視されます。 method="lm"を使用してください。

関連する問題