相関計算に欠損値を扱う

私には、沢山の欠損値を持つ巨大な行列があります。私は変数間の相関を取得したい。相関計算に欠損値を扱う

下記より

cor(na.omit(matrix))

より良いソリューションですか？

cor(matrix, use = "pairwise.complete.obs")

すでに欠損値の20％を超える変数のみを選択しました。

2.意味のある方法はどれですか？

出典

2011-09-16 Delphine

私は第2の選択肢に投票します。あなたは欠けているデータがかなりあるように思えるので、スペースを埋めるために合理的な複数の帰属戦略を探しているでしょう。ハレルのテキスト "回帰モデリング戦略"を参照してください。

出典

2011-09-16 13:49:22

私は2番目のオプションは、より理にかなって、

あなたはHmiscパッケージにrcorr機能を使用して検討するかもしれないと思います。

非常に高速で、ペアワイズ完全観測のみが含まれます。返されるオブジェクトは、これを使用することを意味

各相関各相関値p値の

ために使用される観察の数との相関スコアの

マトリックスを含有します少数の観測（そのしきい値があなたのためのものであれ）に基づいて、またはp値に基づいて、相関値を無視することができます。将来の読者のために
```
library(Hmisc) 
x<-matrix(nrow=10,ncol=10,data=runif(100)) 
x[x>0.5]<-NA 
result<-rcorr(x) 
result$r[result$n<5]<-0 # ignore less than five observations 
result$r 
```

出典

2011-09-18 09:10:51 Iain

Pairwise-complete correlation considered dangerousはcor(matrix, use = "pairwise.complete.obs")が危険とみなされると主張して、このようなuse = "complete.obs")などの代替を示唆し、価値があります。

出典

2017-08-02 16:35:02 Triamus

相関計算に欠損値を扱う

答えて

関連する問題