missing-data

61熱

2答えて

私はランダムフォレストモデルに適合したいと思いますが、私は、私は Error in na.fail.default(list(speed = c(NA, 4, 7, 7, 8, 9, 10, 10, 10, : missing values in object

39熱

4答えて

は空白で、いくつかのNASとの行と他の人と、私は大規模なデータセットに取り組んでいます

一つの特定の列に空白値を持つ行を削除します。私は一度でNASおよび空白を削除するにはどうすればよい df <- data.frame(ID = c(1:7), home_pc = c("","CB4 2DT", "NE5 7TH", "BY5 8IB", "DH4 6PB","MP9 7GH","KN4 5GH"), start_pc = c(NA,"

1熱

1答えて

OLAP/MDXは、さまざまな集計レベルで未知の値を持つデータを処理するのに適していますか？

私はOLAPを初めて使うので、この質問に使用する正しい用語はわからないかもしれません。私は、親/集約セルに大部分はデータがあるが、子/葉セルにはデータが欠けていることが多い（属性値は不明だがゼロではない）、多次元データを扱っている。私は現在、スクリプトとSQLを組み合わせて使用していますが、扱いにくくなっています。 OLAPキューブのように思えますが、MDXは構造の方が適しています。のデータ

0熱

2答えて

数値を数値に変更する - 使用できない値に対処する方法

私は質問から大きなデータセットを持っています。それをSPSSからRにインポートすると（SPSSのStata-Outputを使用して）、それぞれの質問に対する答えが私に要素として与えられました。質問には1から10までの回答がありますが、欠損値が多数あります。 Rもそれらを再認識します。しかし、私はいくつかの計算をしたいと思います。たとえば、回答の平均を計算したいと思います。私は数値を数値に変換

17熱

3答えて

相関計算に欠損値を扱う

私には、沢山の欠損値を持つ巨大な行列があります。私は変数間の相関を取得したい。下記より cor(na.omit(matrix)) より良いソリューションですか？ cor(matrix, use = "pairwise.complete.obs") すでに欠損値の20％を超える変数のみを選択しました。 2.意味のある方法はどれですか？

8熱

3答えて

Rの回帰における残差のNAsをどのように扱うのですか？

だから私はR.に lm断面回帰の残差のある NA値を持ついくつかの問題を抱えてい問題がNA値そのものではない、それはRがそれらを提示方法です。例えば： test$residuals # 1 2 4 5 # 0.2757677 -0.5772193 -5.3061303 4.5102816 test$residuals[3] # 4 # -5.30613 この単純

24熱

1答えて

テーブルに欠損値を含めると結果はR

私は0と5の間の整数ベクトルを持ちます。カウントのヒストグラムを計算したいと思います。たとえば： y <- c(0, 0, 1, 3, 4, 4) table(y) # y # 0 1 3 4 # 2 1 1 2 はしかし、私はまた、結果はゼロ2のゼロ5の、すなわちがあるという事実を含めたいです。返されたベクトルの長さを6にします。これにはtable()を使用できますか？望ましい結果

5熱

2答えて

RのポアソンGLM回帰の欠損値の予測/代入？

私はデータセットに欠損値を代入する方法を模索しようとしています。私のデータセットには、年（2001〜2009年）、月（1-12）、性別（M/F）、年齢グループ（4グループ）の出現回数（不自然、自然および合計）が含まれています。私が検討している帰属法の1つは、（ポアソン）回帰帰属です。私のデータは次のようになります言う：基本的なGLM回帰を行った後 Year Month Gender AgeGr

4熱

1答えて

OpenBUGS：ベルヌーイ分布の欠損値

私はOpenBUGSでR（R2OpenBUGS）を使って観測変数「時間」を確率変数としてモデル化しようとしています。すべての観測時間が利用可能な場合（NAなし）はすべて動作しますが、時間の1つをNAに設定すると何も起こりません。 WinBUGSで同じコードをテストしたところ、トラップエラー 'NIL dereference（read）'が発生しました。だから私の質問は、私のコードに本当に間違ってい