4
私は49変数と4M行のデータフレームを持っています。私は49 x 49の相関行列を計算したいと思います。すべての列はクラス数値です。ここで相関行列計算の高速化R
はサンプルです:
df <- data.frame(replicate(49,sample(0:50,4000000,rep=TRUE)))
私は標準cor
機能を使用していました。
cor_matrix <- cor(df, use = "pairwise.complete.obs")
これは本当に長い時間がかかります。私は16GBのRAMとi5のシングルコア2.60Ghzを持っています。
デスクトップでこの計算を高速化する方法はありますか?
[こちら](http://www.r-bloggers.com/bigcor-large-correlation-matrices-in-r/) – akrun
あなたの主な問題は 'use =" pairwise.complete.obs "です。 '。私のシステム(12列でテスト済み)では 'use =" everything "'の5倍の時間がかかります。 – Roland