私は機械学習には比較的新しいので、決定木の誘導を物事の壮大な計画に置こうとしています。意思決定ツリー(例えば、C4.5またはID3で構築されたもの)は、パラメトリックまたはノンパラメトリックであると考えられていますか?実際の値の決定スプリットポイントは、フィーチャ値のある分布、たとえば平均から決定されるため、実際にパラメトリックであると推測します。しかし、オリジナルのトレーニングデータをすべて保持するというノンパラメトリックな特性は共有していません(kNNと同様)。デシジョンツリー(C4.5など)はノンパラメトリック学習と見なされますか?
6
A
答えて
9
「パラメトリック」という用語は、データの分布を定義するパラメータを指します。 C4.5のような決定木はデータの分布について仮定しないので、それらはノンパラメトリックである。 Gaussian Maximum Likelihood Classification(GMLC)は、データが多変量ガウス分布に従うと仮定しているため(クラスは平均と共分散によって特徴付けられる)、パラメトリックです。最後のセンテンスに関して、トレーニングデータ(例えば、インスタンスベースの学習)を保持することは、ノンパラメトリックな分類器すべてに共通ではない。たとえば、人工ニューラルネットワーク(ANN)はノンパラメトリックであると考えられますが、トレーニングデータは保持されません。
関連する問題
- 1. 巨大なデータセットのデシジョンツリーを学習する
- 2. エリアの学習に最適なAIはどれですか?
- 3. EJBの学習に最適なEJBコンテナはどれですか?
- 4. 機械学習で学習曲線とは何ですか?
- 5. 教師あり学習、(ii)教師なし学習、(iii)補強学習
- 6. 入れ子オブジェクトは良い習慣と見なされますか?
- 7. 機械学習の学習に最適なプログラミング言語は何ですか?
- 8. どのような学習習慣をお勧めできますか?
- 9. osdevの学習に十分な小さなカーネルはありますか?
- 10. ASP.NET継続的な学習
- 11. 学習Javascriptと
- 12. 私はエントロピーを計算するための式を知っていますデシジョンツリー内のエントロピー(機械学習)
- 13. ANNの最適な学習ルールを見つける
- 14. 学習ユニットテストとジャスミン
- 15. ニューラルネットワークトレーニング値なしで学習する
- 16. FLANNの使用は機械学習の対象となりますか?
- 17. オンライン学習が可能なpythonサポートベクターマシンライブラリがありますか?
- 18. タッチタイピングを再学習する時間は? (これはEmacs/VIMなのですか?)
- 19. PHP学習に最適なスタックは何ですか?
- 20. リバースエンジニアリングの学習に最適なツール
- 21. GATEマシン学習が機能しない
- 22. SSISの学習に最適な場所
- 23. Macなしで学習目標C
- 24. ニューラルネットワークが学習していない
- 25. なぜグローバル変数は悪い習慣とみなされますか?
- 26. パーサを学習するための小さな言語
- 27. Djangoの学習は他のアプリケーションにもうまく変換されますか?
- 28. プログラミング言語または「教師なしの言語学習」の逆工学
- 29. MPIとPthreadの学習
- 30. アセンブリとIDAの学習
実際の値が分配によって決定される決定ノードの分割点の考え方はどうですか? – stackoverflowuser2010
配布は必要ありません。すべてのインスタンスを連続属性の値でソートし、情報利得を最大にする2つの値に分割することができます。データの分布については仮定されていない(すなわち、データが正常にまたは他の方法で分散されていると仮定することはない)。 – bogatron
しかし、ディシジョンツリーの特定の実装では、ディストリビューションを使用して分割を実行するとします。それで、それはパラメトリックなこの実装になりますよね? – stackoverflowuser2010