2016-08-26 20 views
-2

私のデータセットには、カテゴリ変数と連続変数の両方を含む19の予測変数があります。私は重要予測変数(すべての予測変数ではない)だけを使用してランダムなフォレストモデルに適合させたいと思います。また、プロセスを100回繰り返す必要があります。何か提案してください?重要な予測変数のランダムフォレスト

+0

「重要な予測変数」とはどういう意味ですか?そして、どのパッケージを使用しようとしていますか:何らかの形でランダムなフォレストを実装する多くの異なるパッケージがあります。 – JWLM

+0

つまり、19の変数をすべて含まない最良のモデル(回帰のような)を見つけたいと思っています。私はこれを "Boruta"パッケージを使って試しました。私は重要な変数を見つけましたが、重要な変数のリストのみを提供するので、選択した変数を使用してランダムなフォレストモデルに適合させることはできませんでした。 – Vijini

答えて

1

機能選択にBorutaパッケージを使用している場合は、https://www.kaggle.com/benhamner/liberty-mutual-group-property-inspection-prediction/random-forest-benchmark/run/20397のサンプルスクリプトをご覧ください。 32行目で、Borutaパッケージを使用して機能選択を実行します。 35行目では、拒否されなかった機能が表示されます。 38行目では、この機能のサブセットにランダムなフォレストを訓練します。

関連する問題