2017-06-09 5 views
0

Python。 Sklearn。 RandomForestClassifier。フィッティング後にRandomForestClassifier、それはgraphvizを作成するために使用することができる一種の「ベスト」「平均化された」コンセンサスツリーを生成しますか?スケルトンからgraphvizを作るRandomForestClassifier(個々のclf.estimators_ではなく)

はい、私はドキュメントを見ました。いいえ、それについて何も言わない。いいえRandomForestClassifierにはtree_属性がありません。しかし、森の中の個々の樹木をclf.estimators_から得ることができるので、私はそれらのうちの1つからグラフビズを作ることができることを知っています。 example of that hereがあります。私はすべての木を得点することができ、森の中で最高のスコアを持つ木を見つけてその木を選ぶことができます...しかし、それは私が求めているものではありません。

「平均化された」最終ランダムランダムフォレスト分類器の結果からグラフビズを作成します。これは可能ですか?あるいは、最終的な分類器は、基礎となる木を使用してスコアと予測を生成しますか?

答えて

2

RandomForestを最終的な予測に到達するために、多数決アンサンブルに(常にではない)は、典型的に、即ち全てフィットサブ識別器が使用され、予測を行うために平均使用アンサンブル方法である。これは通常、すべてのアンサンブルメソッドに当てはまります。 Vivek Kumarがコメントに指摘しているように、予測は常に必ずしも純粋多数決ではなく、個々の予測を組み合わせた重複した多数決または実際には他のエキゾチックな形でもよい(アンサンブル手法に関する研究は深い学習によって幾分脇見されているが、 。

グラフ化することができる平均的なツリーはなく、データセット全体のランダムなサブサンプルとそれらのそれぞれが生成する予測から訓練された決定スタンプだけがあります。それは、木/塊ではなく、平均化された予測そのものです。 wikipedia articleからわずか完全性について


、:(強調鉱山)

ランダム森林またはランダム決定森林が1 [2]、分類、回帰および他のタスクのためのアンサンブル学習法です動作訓練時に多数の決定木を構築し、クラス(分類)のモードまたは個々のツリーの平均の予測(回帰)であるクラスを出力することによって、

モードが多数の予測、すなわち多数決予測である。

+1

@VivekKumarの喝采、回答に追加 –

+0

概念は、ランダムな森林モデルには子供の束(決定木)があります。それらの子供たちは投票することができます。子投票のモード(通常は、しかし時には平均)がスコアまたは予測出力を決定します。それは抽象的な権利ですか? – Jarad

+0

親ツリーが存在するというこの概念につながるので、私はそれらを "_parent_"の "_children_"とはみなしません。親は存在しません。それは、コーパスのランダムなサブセットで訓練された決定木の集まりです。彼らを子供よりもむしろ隣人と考えてください。 大多数の投票(重み付けされた大多数の場合があります)が分類に使用され、平均の投票は回帰(住宅価格や旅行時間のような数値出力を予測するためのもの)です。 –

関連する問題