2017-01-24 11 views
4

テストデータでランダムフォレストモデルを実行しているとき、同じデータセット+モデルで異なる結果が得られます。ここでランダムフォレスト予測を使用した異なる結果R

は、あなたが最初の列の上に違いを見ることができた結果は次のとおり差は非常に小さいが

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR) 

     FALSE TRUE 
FALSE 14 7 
TRUE  13 66 

> table((predict(rfModelsL[[1]],newdata = a)) ,a$earlyR) 

     FALSE TRUE 
FALSE 15 7 
TRUE  12 66 

、私はそれを引き起こしたかを理解しようとしています。私は、predictには "柔軟な"分類閾値があると推測していますが、ドキュメントではそれを見つけることはできませんでした。私は正しい?

は、私はあなたがここにモデルを取り付けていなかったと仮定しますが、それは単に、これらの結果を生産しているpredictコールで事前

+1

のドキュメントを読んでください、それを避ける:答えは?predict.randomForestから、おそらくこれですパッケージ 'randomForest'をもう少し近づけてください。なぜこれが文書化された動作であるのかを完全に説明しています。あなたのrandomForestはツリーの集合であり、モデルを実行するたびにわずかに異なるツリーのセットになります。これは予測関数とは関係がありません。つまり、単にランダムな森林がどのように働くかです。その次に、統計的手法に関する質問はstats.stackexchange.comに属し、stackoverflowには属しません。 –

答えて

5

でいただきありがとうございます。

どれ絆をランダムに壊れているので、これが望ましくない場合には、ランダムフォレスト()で奇数ntreeを使用して により

関連する問題