2011-10-28 19 views
5

Rでは、生データの代わりにカウントデータにボックスプロットを作成します。だから私のテーブルのスキーマは次のようになります

値|カウント
1 | 2
2 |代わり事前集計/グループ化データのボックスプロットR

値後者の場合に、私は単に箱ひげを行うこと
...

(X)の1

...

+0

だからあなたは、グラフの種類をを期待しています。これはちょうど2つのカウント値であり、ボックスプロットはかなり奇妙になるだろう。あなたはおそらくバサルトを考えていますか? –

+0

これは単なるデータ例ですが、私の実際のデータセットにはさらに多くの行があります –

答えて

0

既に要約したものを実行する方法があると確信しています

> dat <- data.frame(Value = 1:5, Count = sample.int(5)) 
> dat 
    Value Count 
1  1  1 
2  2  3 
3  3  4 
4  4  2 
5  5  5 
> rep(dat$Value, dat$Count) 
[1] 1 2 2 2 3 3 3 3 4 4 5 5 5 5 5 

は、単にその周りを箱ひげラップし、あなたが望む結果を得る必要があります:値化データは、しかし、そうでない場合、あなたは repがベクトルを取るという事実を悪用することができます。私はそれを行うためのより効率的な/良い方法があると確信していますが、これはあなたのために動作するはずです。

+0

それはうまくいきますが、私のプロットで複数のカテゴリ(値、数に加えて)のボックスプロットをしたかったので、しかしc'est la vie。提案していただきありがとうございます! –

+0

@John - 心配しないでください。私の他の提案は、ggplot2を見ることです。あらかじめ要約されたデータをそこに渡すことができます。申し訳ありませんが、頻繁に使用するベースグラフィックは使用しません:http://had.co.nz/ggplot2/geom_boxplot.html – Chase

0

私は「担当者」関数でカウントの各列に「適用」機能を使って、最近、同様の問題を解決:

> datablock <- apply(countblock[-1], 2, function(x){rep(countblock$value, x)}) 
> boxplot(datablock) 

...上記の自分の価値観は、最初の列にあることを前提としていその後の列にはカウントデータが含まれます。別の変数を分類

ために、例えば必要な場合

rep
0

data.frameの組み合わせアプローチとして使用することができます。

with(data.frame(v1=rep(data$v1,data$count),v2=(data$v2,data$count)), 
    boxplot(v1 ~ v2) 
) 

関連する問題