これはパネルデータです。すべての観測値が変数PERMCOでグループ化されています。変数vwretdに2つ以上の欠損値を持つグループをすべて削除する必要があります。日付1935-06-30の変数PRCまたはSHROUTに値がない。私はこれを達成する方法がわかりません。2つ以上の欠損値を持つグループを削除する
1
A
答えて
0
データセットはdata.table
と思われるので、data.table
メソッドでこれを行うことができます。 'if
'(sum(is.na(vwretd))
)の数の否定(!
)が2より大きいか、(|
)all
'1935-06'に対応する 'PRC'(または 'SHROUT')要素が 'PERMCO' -30 "date"がNA
である場合、特定のグループに対してTRUEであれば、Data.tableのサブセットを取得します。
library(data.table)
dt[, if(!(sum(is.na(vwretd)) >2| all(is.na(PRC[date == "1935-06-30"])) |
all(is.na(SHROUT[date == "1935-06-30"]))) .SD , by = PERMCO]
関連する問題
- 1. 欠損値を持つデータフレームの整列
- 2. 欠損値を持つint配列numpy
- 3. 欠損値を持つExcel平均
- 4. 上の行の値を持つ列に欠損値を追加します。
- 5. Spark:欠損値を持つDataFrameの相関を計算する
- 6. N個以上のエントリを持つレコードを削除する
- 7. 欠損値を持つデータフレームを座標でマージする
- 8. SQLテーブル2の欠損値を見つけている2つのテーブルのクエリ
- 9. 2つ以上のフォームを持つビュー
- 10. 2つ以上の値を持つHTML5 LocalStorage
- 11. Rにおける欠損値を持つ箱ひげ - ggplot
- 12. 補間を削除する欠損値の時系列プロット
- 13. 欠損値を持つRのデータのマッピング
- 14. 2つの列の欠損値を除外する観測のサブセットを見つけよう
- 15. Mathematica:欠損値を持つリストの操作
- 16. 2つ以上のテーブルから削除する
- 17. パンダの欠損値を含む行を削除します
- 18. Pandasを使って最大欠損値を持つ列を見つけよう
- 19. 2つのオブジェクト間の差異と欠損値の追加
- 20. 5%以上欠けているデータを持つ行
- 21. 塗りつぶし欠損値(パンダ)
- 22. 2つ以上の異なる値にPHP配列をグループ化する
- 23. 同じIDを持つクエリ文字列で2つ以上の値を渡す
- 24. データフレームに欠損値が重複している値を削除する
- 25. リストから2つ以上のランダムな項目を削除する
- 26. バイナリツリー上で2つの子の削除
- 27. 2つ以上のグループを持つ離散データのパーセンテージテーブルを作成する簡単な方法は?
- 28. 2つ以上の変数を持つループの場合
- 29. 2つ以上のワーカープロセスを持つAsp.netアプリケーション
- 30. 2つ以上のフィールドを持つSQL検索
私は 'base R 'から' subset'がこれを行うことができると思います。 – user2100721
@ user2100721の提案はおそらく十分です。より多くの支援が必要な場合は、(1)あなたの基準に合致するデータを含め、(2)ボランティアが簡単にテストできる方法で提供してください。例えば、全てのobsがそのフィールドが一定であるので、PERMCOによってグループ化されることは明らかではない。私は、あなたの基準が使用可能となる条件を十分に実証する、多様で小さなデータセットを提供することをお勧めします。 (ヒント:実際のデータである必要はありません。必要な作業を行うためにコードを学習することができれば、擬似的に動作します) – r2evans