私は参加者による複数回の試行があるオンライン調査データセットを持っており、行番号で複数のケースを選択的に削除する必要があります。データはdata.frameとして保存されます。私はこれを手動で行うことができることを認識していますが、必要に応じて後で使用できるように、これをスクリプトとして保持したい、または誰かが私がやったことを迅速かつ効率的に複製することができます。私は複数の場所で検索しましたが、私の質問は単純すぎるようだ:私は試してみました何data.frame内の特定のベクトルに基づいて行を削除するにはどうすればよいですか?
。私は不完全なケース( 'complete.cases'と 'na.omit')に基づいて行を削除する方法を見てきましたが、特にdata.frame内の特定のベクトルに基づいて行を削除しようとしています
データ:
user_id var1 var2 var3
1 NA 13 bob
3 time 37 fred
4 second NA lisa
5 second 28 lisa
ので、上記data.frameに私は、ユーザーリサによって複数の試みを持っています。私は彼女の最後の試行を続行したいのですが、それはより完全であるため(var2
にNAはありません)、var3
ではなくuser_id
に基づいて行を削除する必要があります。
を持って、あなた特定のユーザ(var3)の1つを除くすべてのケースを削除したい場合、最初に欠落しているものを削除したいのですか? –
したがって、 'completeness'はvar1とvar2の非NAsの数ですか? var3の各値に対して最も完全な行を保持したいのですか?だから、ボブはリサの最初の行程ほど不完全であったにもかかわらず、彼のエントリーは、彼が決して上手くいったことがないために残っていますか?それは正しいのでしょうか? – Spacedman
はい、上記のデータから行4を削除したいのですが、それはuser_idです4。私は、いくつかのNAsを持つ行には関心がありませんが、調査を複数回試みた回答者による最も完全な試みを維持しています。 –