2012-02-10 8 views
1

生徒のクラスからの10-Dデータがあるとします。データはグレードコース、クラスのすべての学生の講義などの時間の号のようなパラメータを含んでいます。今度は、の講義時間数の影響を分析したいと考えています。グレードにあります。 我々は密接に私たちのパラメータを見れば、学生の名前グレードとは何の関係もありませんが、学生が撮影したコースグレードに影響を与える「かもしれません」。機械学習の問題におけるパラメータの相互依存

したがって、互いに依存するパラメータと完全に独立したパラメータが存在する可能性があります。私の質問は、どのパラメータが私たちの分類/回帰問題に影響を与えているのか、そうでないのかをどのように決定するのでしょうか?

PS:正確な解決策を探しているわけではありません。もし誰かが私に正しい方向やキーワードをGoogle検索のために表示できるのであれば、それは十分であるはずです。おかげさまで

答えて

1

これはindependent component analysisの問題です。 ICAは、データセットの統計的に独立したコンポーネントを見つけるための一連のメソッドです。これは困難な問題であり、良い解決策を見つけるための多種多様なアルゴリズムが存在します。一般的なアルゴリズムはFastICAです。

whiteningdecorrelationの関連概念もあります。

関連する問題