頻度テーブルで連続変数を使用するにはどうすればよいですか？

-6

私は以下のタイプの1000行のテーブルを持っており、すべてのカテゴリの "df"変数の連続する "count"変数の合計と平均を計算する必要があります。頻度テーブルで連続変数を使用するにはどうすればよいですか？

私はこれをtable()関数で解決しようとしましたが、私は連続変数を使用しているため、解決策には取り組んでいません。

出典

2016-08-03 Slavo

あなたは 'aggregate'を探していますか？おそらく 'aggregate（count〜df、yourDF、mean）' – Sotos

おそらく、http://stackoverflow.com/questions/1660124/how-to-sum-a-variable-by-groupまたはhttp：// stackoverflowの複製です。 com/questions/21982987/data-group-in-a-data-frame –

多分これは

> df3 <- aggregate(count ~ df , df, mean) 
> df3 
    df count 
1 a 5.666667 
2 f 3.000000 
3 g 4.500000 
4 l 4.000000 
5 s 6.000000 

> df2 <- aggregate(count ~ df , df, sum) 
> df2 
    df count 
1 a 17 
2 f  3 
3 g  9 
4 l  8 
5 s 12

単純な集計関数がそれを行うことができ、あなたを助けるでしょう。 df3のカウントは平均であり、df2のカウントは合計です。

出典

2016-08-03 09:16:26

重複した投稿には回答しないでください。 – zx8754

これは特にユニークな質問ではありませんが、提案された重複した質問は1つの要約統計量を求めるだけです。これはdplyrに解決するための簡単な問題であるとして、私は私がこれを投げるだろうと思っていた。

dframe <- data.frame(df = c("a", "f", "g", "l", "a", "s", "l", "s", "a", "g"), count = c(5, 3, 8, 2, 10, 4, 6, 8, 2, 1)) 
dframe 
    df count 
1 a  5 
2 f  3 
3 g  8 
4 l  2 
5 a 10 
6 s  4 
7 l  6 
8 s  8 
9 a  2 
10 g  1 

library(dplyr) 
dframe %>% group_by(df) %>% summarise(sum = sum(count), mean = mean(count)) 
Source: local data frame [5 x 3] 

     df sum  mean 
    (fctr) (dbl) (dbl) 
1  a 17 5.666667 
2  f  3 3.000000 
3  g  9 4.500000 
4  l  8 4.000000 
5  s 12 6.000000

あなたは（その集計を見ることができます）あなたは何を計算することができます、そしてあなた各グループのしかし多く、要約統計好き。

出典

2016-08-03 09:19:09 doctorG

私は間違っていないよ場合は、次のコード

library(dplyr) 
daf %>% 
    group_by(df) %>% 
    summarise(Sum = sum(count), Count = n()) %>% 
    ungroup() %>% 
    arrange(df)

「DAF」を探しているが、私が働いているデータセットです。

Rプログラミングをお楽しみください！

出典

2016-08-03 09:29:24 vaibhavnag

頻度テーブルで連続変数を使用するにはどうすればよいですか？

答えて

関連する問題