2016-08-03 3 views
-6

私は以下のタイプの1000行のテーブルを持っており、すべてのカテゴリの "df"変数の連続する "count"変数の合計と平均を計算する必要があります。頻度テーブルで連続変数を使用するにはどうすればよいですか?

私はこれをtable()関数で解決しようとしましたが、私は連続変数を使用しているため、解決策には取り組んでいません。

df count 
1 a  5 
2 f  3 
3 g  8 
4 l  2 
5 a 10 
6 s  4 
7 l  6 
8 s  8 
9 a  2 
10 g  1 
+2

あなたは 'aggregate'を探していますか?おそらく 'aggregate(count〜df、yourDF、mean)' – Sotos

+3

おそらく、http://stackoverflow.com/questions/1660124/how-to-sum-a-variable-by-groupまたはhttp:// stackoverflowの複製です。 com/questions/21982987/data-group-in-a-data-frame –

答えて

0

多分これは

> df3 <- aggregate(count ~ df , df, mean) 
> df3 
    df count 
1 a 5.666667 
2 f 3.000000 
3 g 4.500000 
4 l 4.000000 
5 s 6.000000 

> df2 <- aggregate(count ~ df , df, sum) 
> df2 
    df count 
1 a 17 
2 f  3 
3 g  9 
4 l  8 
5 s 12 

単純な集計関数がそれを行うことができ、あなたを助けるでしょう。 df3のカウントは平均であり、df2のカウントは合計です。

+2

重複した投稿には回答しないでください。 – zx8754

0

これは特にユニークな質問ではありませんが、提案された重複した質問は1つの要約統計量を求めるだけです。これはdplyrに解決するための簡単な問題であるとして、私は私がこれを投げるだろうと思っていた。

dframe <- data.frame(df = c("a", "f", "g", "l", "a", "s", "l", "s", "a", "g"), count = c(5, 3, 8, 2, 10, 4, 6, 8, 2, 1)) 
dframe 
    df count 
1 a  5 
2 f  3 
3 g  8 
4 l  2 
5 a 10 
6 s  4 
7 l  6 
8 s  8 
9 a  2 
10 g  1 

library(dplyr) 
dframe %>% group_by(df) %>% summarise(sum = sum(count), mean = mean(count)) 
Source: local data frame [5 x 3] 

     df sum  mean 
    (fctr) (dbl) (dbl) 
1  a 17 5.666667 
2  f  3 3.000000 
3  g  9 4.500000 
4  l  8 4.000000 
5  s 12 6.000000 

あなたは(その集計を見ることができます)あなたは何を計算することができます、そしてあなた各グループのしかし多く、要約統計好き。

1

私は間違っていないよ場合は、次のコード

library(dplyr) 
daf %>% 
    group_by(df) %>% 
    summarise(Sum = sum(count), Count = n()) %>% 
    ungroup() %>% 
    arrange(df) 

「DAF」を探しているが、私が働いているデータセットです。

Rプログラミングをお楽しみください!

関連する問題