私は各IDの非常に大きなデータセットの確率を1ヶ月間計算しようとしていますが、私はここでフォーラムで "mutate function"私が望むように働く。私はIDと月をサブセット化して、単に($月DF)1 /長さを使用していた私の臨床試験のための私のデータはそれに似ていますし、私は列Pを計算したい。:mutate r条件付きdata.frame with filter
ID Month Day E P
1 200701 20070101 .3 .333
1 200701 20070102 .5 .333
1 200701 20070105 .5 .333
1 200702 20070106 .6 1
2 200701 20070101 .4 .5
2 200701 20070103 .3 .5
。
u <- subset(df, !duplicated(df$ID))
s <- subset(df, !duplicated(df$Month)) #Month is defined as date variable
、その後、それに類似したformularでそれらを変異: 私の考えは今、すべてのIDを抽出するためだった
mutate(df, p = 1/length(df$ID == u & df$month ==s))
これは残念ながら動作しません。
またはループを実行する必要がありますか?
あなたの出力を表示してください。 – nicola
この 'df%>%group_by(ID、Month)%>%mutate(P = 1/n())' – Sotos
'df $ P < - のみを使って(df、1/ave (ID番号、ID、月、FUN =長さ)) ' – akrun