missing-data

    61

    2答えて

    私はランダムフォレストモデルに適合したいと思いますが、私は、私は Error in na.fail.default(list(speed = c(NA, 4, 7, 7, 8, 9, 10, 10, 10, : missing values in object

    39

    4答えて

    一つの特定の列に空白値を持つ行を削除します。私は一度でNASおよび空白を削除するにはどうすればよい df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", "DH4 6PB","MP9 7GH","KN4 5GH"), start_pc = c(NA,"

    1

    1答えて

    私はOLAPを初めて使うので、この質問に使用する正しい用語はわからないかもしれません。 私は、親/集約セルに大部分はデータがあるが、子/葉セルにはデータが欠けていることが多い(属性値は不明だがゼロではない)、多次元データを扱っている。私は現在、スクリプトとSQLを組み合わせて使用​​していますが、扱いにくくなっています。 OLAPキューブのように思えますが、MDXは構造の方が適しています。のデータ

    0

    2答えて

    私は質問から大きなデータセットを持っています。それをSPSSからRにインポートすると(SPSSのStata-Outputを使用して)、それぞれの質問に対する答えが私に要素として与えられました。 質問には1から10までの回答がありますが、欠損値が多数あります。 Rもそれらを再認識します。 しかし、私はいくつかの計算をしたいと思います。たとえば、回答の平均を計算したいと思います。 私は数値を数値に変換

    17

    3答えて

    私には、沢山の欠損値を持つ巨大な行列があります。私は変数間の相関を取得したい。 下記より cor(na.omit(matrix)) より良いソリューションですか? cor(matrix, use = "pairwise.complete.obs") すでに欠損値の20%を超える変数のみを選択しました。 2.意味のある方法はどれですか?

    8

    3答えて

    だから私はR.に lm断面回帰の残差のある NA値を持ついくつかの問題を抱えてい 問題がNA値そのものではない、それはRがそれらを提示方法です。例えば : test$residuals # 1 2 4 5 # 0.2757677 -0.5772193 -5.3061303 4.5102816 test$residuals[3] # 4 # -5.30613 この単純

    24

    1答えて

    私は0と5の間の整数ベクトルを持ちます。カウントのヒストグラムを計算したいと思います。たとえば: y <- c(0, 0, 1, 3, 4, 4) table(y) # y # 0 1 3 4 # 2 1 1 2 はしかし、私はまた、結果はゼロ2のゼロ5の、すなわちがあるという事実を含めたいです。返されたベクトルの長さを6にします。これにはtable()を使用できますか? 望ましい結果

    5

    2答えて

    私はデータセットに欠損値を代入する方法を模索しようとしています。私のデータセットには、年(2001〜2009年)、月(1-12)、性別(M/F)、年齢グループ(4グループ)の出現回数(不自然、自然および合計)が含まれています。 私が検討している帰属法の1つは、(ポアソン)回帰帰属です。 私のデータは次のようになります言う:基本的なGLM回帰を行った後 Year Month Gender AgeGr

    4

    1答えて

    私はOpenBUGSでR(R2OpenBUGS)を使って観測変数「時間」を確率変数としてモデル化しようとしています。すべての観測時間が利用可能な場合(NAなし)はすべて動作しますが、時間の1つをNAに設定すると何も起こりません。 WinBUGSで同じコードをテストしたところ、トラップエラー 'NIL dereference(read)'が発生しました。だから私の質問は、私のコードに本当に間違ってい