機械学習の問題におけるパラメータの相互依存

生徒のクラスからの10-Dデータがあるとします。データは名、グレード、コース、クラスのすべての学生の講義などの時間の号のようなパラメータを含んでいます。今度は、の講義時間数の影響を分析したいと考えています。グレードにあります。我々は密接に私たちのパラメータを見れば、学生の名前はグレードとは何の関係もありませんが、学生が撮影したコースはグレードに影響を与える「かもしれません」。機械学習の問題におけるパラメータの相互依存

したがって、互いに依存するパラメータと完全に独立したパラメータが存在する可能性があります。私の質問は、どのパラメータが私たちの分類/回帰問題に影響を与えているのか、そうでないのかをどのように決定するのでしょうか？

PS：正確な解決策を探しているわけではありません。もし誰かが私に正しい方向やキーワードをGoogle検索のために表示できるのであれば、それは十分であるはずです。おかげさまで

出典

2012-02-10 user12345

あなたが探している技術は、dimension reductionと呼ばれています。スタンフォードmachine learning classは、1つの方法（principal component analysis）になります。

出典

2012-02-10 15:10:57 zinglon

これはindependent component analysisの問題です。 ICAは、データセットの統計的に独立したコンポーネントを見つけるための一連のメソッドです。これは困難な問題であり、良い解決策を見つけるための多種多様なアルゴリズムが存在します。一般的なアルゴリズムはFastICAです。

whiteningとdecorrelationの関連概念もあります。

出典

2012-02-12 01:30:48

機械学習の問題におけるパラメータの相互依存

答えて

関連する問題