-1
メモリ消費量に関する問題については、mclapply
の投稿が多数ありますが、私の場合に役立つものがあるかどうかを確認しようとしています。効率的に/マルチスレッドで回帰予測を実行する
私は(変数行列Xによって応答y)〜600 60,000によってマトリックスランダムフォレストモデルを適合しています:
library(randomForest)
fit <- randomForest(x=X,y=y)
を私は、ランダムなフィット感に、その何のためにそのフィットを比較します私がやってるです:
library(parallel)
set.seed(1)
random.list <- mclapply(1:1000,function(f){
idx <- shuffle(nrow(X))
random.y <- predict(object=fit,newdata=X[idx,],type="response")
}, mc.cores = ncores)
残念ながら、これはあまりにも、それは非現実的になり、メモリ(100ギガバイト以上のものが必要)集約的です。
私が実行している環境はLinuxです。
提案がありますか?