2016-06-27 5 views
-1

メモリ消費量に関する問題については、mclapplyの投稿が多数ありますが、私の場合に役立つものがあるかどうかを確認しようとしています。効率的に/マルチスレッドで回帰予測を実行する

私は(変数行列Xによって応答y)〜600 60,000によってマトリックスランダムフォレストモデルを適合しています:

library(randomForest) 
fit <- randomForest(x=X,y=y) 

を私は、ランダムなフィット感に、その何のためにそのフィットを比較します私がやってるです:

library(parallel) 
set.seed(1) 
random.list <- mclapply(1:1000,function(f){ 
    idx <- shuffle(nrow(X)) 
    random.y <- predict(object=fit,newdata=X[idx,],type="response") 
}, mc.cores = ncores) 

残念ながら、これはあまりにも、それは非現実的になり、メモリ(100ギガバイト以上のものが必要)集約的です。

私が実行している環境はLinuxです。

提案がありますか?

答えて

0

mclapply2 {snpEnrichment}のようなものは、妥当な簡単な解決策です。

関連する問題