-1
R version 3.2.1
とOS X Yosemite (Version 10.10.4)
で作業しています。R:未使用の引数(.SDcols = variable)でcsvをフィルタリングする
使用してCSVファイルを読む:次に
> train = read.csv("~/Downloads/train.csv", header = TRUE)
変数初期化:
> cat_var <- names(train)[which(sapply(train, is.character))]
> cat_var <- c(cat_var, 'BedroomAbvGr', 'HalfBath', ' KitchenAbvGr','BsmtFullBath', 'BsmtHalfBath', 'MSSubClass')
今、私はcat_var
列の合計はnull値を見つけたいが、次のエラーを取得:
> colSums(sapply(train[,.SD, .SDcols=cat_var], is.na))
Error in `[.data.frame`(train, , .SD, .SDcols = cat_var) :
unused argument (.SDcols = cat_var)
sum
とis.na
を使用して.SDcols
で言及した列のNA要素の数を見つけます。しかし、data.tableを使用すると、次のエラーが発生します。 '.SDcolsのいくつかの項目は列名ではない(またはNAである)' – nish@nish 'cat_var'の要素をチェックして、その列名が 'train'に含まれているか、列車内に異常な列名があるかどうかを確認してください..私が示したコードはうまくいくはずです。私は '1.10.0'バージョン – akrun