2017-08-22 6 views
-1

scikit-learnを使用してランダムフォレスト分類子を実行しようとしました。確率と信頼の違いを理解したいと思います。 5つのクラスA、B、C、D、Eがあるとしましょう。今度は私がpredict_proba()を実行し、クラスAのマッチを得ると、その確率は5つのクラスの中でクラスAである確率を返しますか?つまり、クラスAの確率が0.95で残りのクラスが0.05である場合、残りのクラスは0.05の確率で共有されますか?その場合、予測の信頼水準を得る方法があるかどうかを理解したいと思います。これは、クラスAが0.95の確率でクラスAを予測したと自信を持っていることを意味します。そのような仕組みはありますか?Pythonを使用したscikit-learnのランダムフォレストアルゴリズムでの信頼性と確率

私がこれを理解したいのは、5つのクラスに属していない分類データを投げ込むと仮定しているからです。これらのクラスに属していないことを捨てたいのです5クラス。私はクラシファイアが現在、5つのクラスのうちの1つにそれを適合させようとし、おそらく高い確率を返すことができると感じていますか?それについて自信がないにもかかわらず?

ありがとうございました!

+0

を使用する必要がある信頼区間を追加するには。 – error

答えて

0

確率は信頼区間ではありません。

質問はプログラミングについて、実際にはないので、これは[検証クリス](https://stats.stackexchange.com/)に属しているように見えますが、私には、この拡張http://contrib.scikit-learn.org/forest-confidence-interval/

+0

あなたの応答Dirkに感謝します。 random_forest_error()は分散を返し、例は分散を使って標準偏差を計算することを示しています。標準偏差を低くすると、信頼度は高くなりますか? – Prashanth

関連する問題