0

ここで、正確に何が起こっているのですか。ジェネティックモデルと識別モデルは、条件付きP(x | y)とジョイントP(x、y)の確率分布を学習しているようです。しかし、基本的なレベルでは、確率分布によって意味されることを自分自身に確信させることはできません。"機械学習アルゴリズムは確率分布を学ぶ"というフレーズはどういう意味ですか?

答えて

1

これは、モデルがトレーニングサンプルを作成したディストリビューションの推定値として機能しているか、その推定値を使用して他の予測を実行していることを示します。

簡単な例を与えるために、一連の観測を考えてみましょう。{x[1], ..., x[N]}あなたがガウス推定を訓練したいとしましょう。これらのサンプルから、このガウス推定のための最尤パラメータは、データ

Mean = 1/N * (x[1] + ... + x[N])

Variance = 1/(N-1) * ((x[1] - Mean)^2 + ... + (x[N] - Mean)^2)

の平均と分散だろう今から新しいサンプルを生成することが可能なモデル(推定値を持っていますあなたの訓練サンプルが得られた分布を調べてください。

もう少し洗練されていれば、ガウス混合モデルのようなものを考えることができます。これは同様に、あなたのデータを与えられたモデルの最も適合するパラメータを推測します。この時間を除いて、そのモデルは複数のガウス分布で構成されています。その結果、いくつかのテストデータが与えられた場合、観測点における確率密度に対する各ガウス成分の相対的な寄与に基づいて、確率的に各サンプルにクラスを割り当てることができます。これはもちろん、機械学習の基本的な前提を作ります:あなたのトレーニングとテストのデータは、両方とも同じ分布(あなたが確認しなければならないもの)から引き出されます。

関連する問題