各列の最大値を別々に計算したいだけです。 sapply
単純なメモリ・オーバーフローに入った使用:data.tableのsapplyの代わりのイディオムは何ですか?
# dt is my data.table object
res <- sapply(dt, max, na.rm=T) # fails due to memory problems
それが11ギガバイトの全体的なサイズで、100万行1000列の疎テーブルです。
require(data.table)
dtDate <- fread(paste0(filePath, "train_date.csv"))
dim(dtDate)
require(pryr)
object_size(dtDate)
正確に使用したコードは何ですか?データサイズは?あなたの仕様は何ですか? [this](https://rawgit.com/wiki/Rdatatable/data.table/vignettes/datatable-intro.html)を読んだことがありますか? * lapply用のイディオム*などの例があります。 –
おそらく、 'apply(df、2、max)'を使うのが良いでしょう。 – Istrel
1mio行と1000列のスパーステーブルで、全体のサイズは11GB @DavidArenburgです。 – CodingButStillAlive