Andrew Ngの機械学習コースに続いて、追加データサンプルの必要性を評価するために学習曲線(コスト対サンプル数)をプロットする方法を試したいと思います。しかし、ランダムフォレストでは、私は学習曲線を描く方法について混乱しています。ランダムフォレストは、例えば線形回帰のような基本的なコスト関数を持つようには見えないので、y軸上で正確に何を使うべきかわからない。ランダムフォレストモデルの学習曲線をどのようにプロットしますか?
1
A
答えて
1
ここではいくつかのカテゴリを混乱させる可能性があります。まず
、機械学習において、learning curveが経験する性能を関連
プロットとして定義されている経験が数かもしれないが....パフォーマンスは、学習システムの誤り率や精度であります学習に使用されるトレーニングの例、またはシステムモデルのパラメータを最適化する際に使用される反復の数などが含まれます。
ランダムフォレストと線形モデルの両方を回帰または分類に使用できます。回帰の
、コストは、通常、予測信号との差分のL2ノルム(although sometimes the l1 norm)の関数です。
分類の場合、コストは通常、不一致またはログ損失です。
重要なメカニズムが線形モデルであるか、フォレストであるかは問題ではありません。どのタイプの問題であるのか、コスト関数は何かを決定する必要があります。それを決定した後、学習曲線をプロットすることは、信号と予測の関数に過ぎません。
関連する問題
- 1. 機械学習で学習曲線とは何ですか?
- 2. LDAPとActive Directoryの学習曲線
- 3. JD Edwardsでの開発の学習曲線は何ですか?
- 4. トレーニング/検証学習曲線の結果をどのように解釈するか?
- 5. JAX-RSクライアント側のフレームワークの学習曲線
- 6. NHibernateとLINQ To Entitiesの学習曲線の比較はありますか?
- 7. Java GUI - 学習曲線を加速する
- 8. 学習曲線にSciKitランダムフォレストのoob_decision_function_を使用する方法は?
- 9. ggplot2とdrcによる線量応答曲線のプロット
- 10. プロット曲線はX軸固定の下にありますか?
- 11. どのような学習習慣をお勧めできますか?
- 12. SageMathで楕円曲線をプロットする
- 13. Python Basemapで曲線をプロットする
- 14. SAS。どのように2つの比較グループの2つのROC曲線を同じプロットにするか?
- 15. Rの曲線の漸近線をプロットする方法は?
- 16. は、迅速な展開、学習曲線と将来のスコープを比較します:PHP対ルビーvs.Netプラットフォーム
- 17. 学習曲線 - トレーニングの精度がなぜ高まり始めたのはなぜですか?
- 18. は、私は回帰曲線をプロットしようとしていた多項式
- 19. SQL Serverのインデックスチューニングをどのように学習できますか?
- 20. NHiberneteまたはSubsonic! (最速タイムを開発し、最も簡単な学習曲線と柔軟に決定ORM)
- 21. R - 集計ポイントとロジスティック曲線プロット
- 22. Rで、非線形曲線をプロットする
- 23. データに別の曲線をプロットするR
- 24. ggplot2の使用線をプロットした後、どのようにaes()を使って点をプロットできますか?
- 25. 低い学習曲線を持つEclipse用の優れたSWING-GUIプラグインのヒントを検索する
- 26. Wekaマシン学習:どのようにNaive Bayesクラシファイアをインタープレットするのですか?
- 27. 線形関数近似によるQ学習
- 28. JavaScript - ちょうど学習のため
- 29. ROC曲線をプロットするためのlibsvm
- 30. グラフのヒストグラムと密度関数曲線をプロットする
私はそれを分類に使用していますので、コストはミスマートかロスロスかと思いますか?これは、私が学習曲線をサンプル数に対してプロットするために使用するものですか? – user123959
@ user123959はい。それらは非常に論理的な選択肢になります。 –
ありがとうございます。一つの最後のことは、別のスタックオーバーフローに関する質問(http://stats.stackexchange.com/questions/78590/learning-curve-shows-decreasing-accuracy)で読んだこのコメントを説明できますか? (ほとんどの他のMLメソッドではない)トレーニングに間違いを見ている - user31264で述べたように、この数字は単なる無意味なもので、トレーニングセットに基づくエラー近似が必要な場合は、OOBエラーを使用してください。これが、私が、コスト関数をプロットする同じアプローチが、ランダムなフォレストにとって実行可能ではないと考えている理由です。 – user123959