2013-01-21 7 views
5

私はウェブ上で多くの同様の質問に出くわしましたが、理解できる私の問題を解決するものは見つかりませんでした。私の理解を助けるために、ここでいくつかの説明をいただきたいと思います。前もって感謝します!Matlabを使用してPCAで変数の重要性を判断する方法は?

ので、

[COEFF,SCORE,latent,tsquare] = princomp(X) 

私はcoeffため、列はコンポーネントの分散を減少させるためにあることを理解しています。しかし、私はcoeffの答えが示すように、主成分(PC)の重要性ではなく、変数(元のデータセット)の重要性を知っていますか?私が持っている変数の重要性をランク付けする方法はありますか?

私は多くの統計ソフトウェアがこれを行うことができ、どの元の変数がプロットに最も寄与しているかを示し、過度のフィッティングの問題を防ぐために除去できるものを示しました。 MatLabでこれを行う方法はありますか?

私の目的は、データを2Dプロットにプロットすることです。これは、最も重要なコンポーネント分散を保持するPC1とPC2を使用することを意味します。もう一度、どの変数を保持し、どの変数を破棄すべきかをどのように知っていますか?

誰でもこのことを私に説明できますか?ありがとう!

答えて

2

あなたが唯一の可視化のために2次元平面にデータの投影を気にしている場合、すべての手段によってSCOREから各点の最初の二つの座標を取る - これらは、あなたの質問でPC1PC2と呼ばれる座標です。

ただし、次の2つのコンポーネントにPC1に最も貢献しXをしているかを知ることを望む場合PC2あなたが最大の絶対値のCOEFFの最初の2つの列のエントリを見つける必要があります。 COEFFの最初の2つの列はXの要素の線形結合を表し、PC1PC2を生成します。

+0

しかし、2番目の部分については、COEFFの最初の2つの列で最大絶対値を取ると述べました。しかし、これらの値がどの変数から来るのか、どのように知っていますか?彼らは私がそれらをどのように定義するのと同じ順序でランクされていますか?私はCOEFFの列がコンポーネントの分散の順番に並べ替えられていることを知っているので、行についてはわかりません。行が並べ替えられておらず、入力順に保管されていると言っていますか? – maureen

+0

はい、私は2番目の部分に問題があります。申し訳ありません、以前の投稿にいくつかの問題がありました.... – maureen

+0

@maureen行列を使った線形変換に精通していますか? – Shai

関連する問題