4
テストデータでランダムフォレストモデルを実行しているとき、同じデータセット+モデルで異なる結果が得られます。ここでランダムフォレスト予測を使用した異なる結果R
は、あなたが最初の列の上に違いを見ることができた結果は次のとおり差は非常に小さいが
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 14 7
TRUE 13 66
> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR)
FALSE TRUE
FALSE 15 7
TRUE 12 66
、私はそれを引き起こしたかを理解しようとしています。私は、predict
には "柔軟な"分類閾値があると推測していますが、ドキュメントではそれを見つけることはできませんでした。私は正しい?
は、私はあなたがここにモデルを取り付けていなかったと仮定しますが、それは単に、これらの結果を生産しているpredict
コールで事前
のドキュメントを読んでください、それを避ける:答えは
?predict.randomForest
から、おそらくこれですパッケージ 'randomForest'をもう少し近づけてください。なぜこれが文書化された動作であるのかを完全に説明しています。あなたのrandomForestはツリーの集合であり、モデルを実行するたびにわずかに異なるツリーのセットになります。これは予測関数とは関係がありません。つまり、単にランダムな森林がどのように働くかです。その次に、統計的手法に関する質問はstats.stackexchange.comに属し、stackoverflowには属しません。 –