2016-03-30 13 views
5

私は、同じ結果を再現できるように、一般的に種がセットされていることを知っています。しかし、種子の設置は実際にはランダムな森林の中で何をしますか? RのrandomForest()の引数のいずれかをnTreeまたはsampSizeのように変更しますか?ランダムフォレストでシードは何をしますか?

ランダムフォレストモデルでは、毎回異なるシードを使用していますが、異なるシードがランダムフォレストモデルにどのように影響するかを知りたいと考えています。

+1

[R.における種子については、ここで参照](http://stackoverflow.com/questions/13605271/reasons-for-using-the-set-seed-function)ランダムなツリーを生成し、シードは同じ出力を保証します。通常の使用では、シードで何もしないでください。デフォルトでは「ランダム」になります。 – Axeman

+0

異なる種子は 'nTree'や' sampSize'を変更しませんが、 'ntree'のようなパラメータを低い値に設定すると、モデルの結果を少し変更することができます。 – Axeman

+1

@Axemanは解説を説明とともに追加することを検討します –

答えて

2

木が種から成長し、その森林;-)(SCNR)を行う

建てランダムフォレストへのさまざまな方法があります、しかし、共通のすべてのは、複数のツリーが構築されていることです。 1つの決定木で分類精度を向上させるには、同じツリーのnTree倍になるように、ランダムなフォレスト内の個々のツリーを変更する必要があります。この違いは、木の生成にランダム性を導入することによって達成されます。ランダム性は種によって影響され、同じ種を使用すると常に同じ結果が生成されるということが種子にとって最も重要です。

ランダム性がツリー構築にどのように影響しますか?複数の方法があります。 - ランダムなサブセットのツリーを構築します。これは、訓練例のサブセットが描かれた森林の個々の樹木ごとであり、次にこのサブセットの木が構築されます。 - 木の各決定点で、決定属性がランダムに選択されます。

多くの場合、これら2つの要素が結合されています。 `randomForest`ので

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1

関連する問題