2016-12-23 2 views
0

私は、プロットのカラーバブルでリッカートスケール評価データを要約しようとしています。現在、私はコミュニケーションしようとしているものに近いミスを提供している、ジッタがかかったファセットの散布図の上に重ねられたバイオリンプロットを持っています。コンティンジェンシーテーブルのセルの新しい変数の平均を計算します。

faceted scatterplot of jittered 7-point ratings shaded by continuous variable

理想的には、私はちょうどそのスコアを有していた項目の数(または割合)によって大きリッカート尺度上の点の各々に対して気泡を有し、及びspKnownShownの平均値の影になります変数。 Likert-facet-x軸のコンビネーションテーブルを作成するのは簡単ですが、各セルをspKnownShownの平均にリンクするにはどうすればよいですか?コンティンジェンシー・テーブルから実際のプロットに次の飛躍をとるための推奨事項があれば歓迎されます。

私はデータを共有することはできませんが、機密保持契約のもとであることを謝罪します。

+0

あなたはいくつかのデータを投稿できますあなたが何をしているかをゆるやかに表現する一緒に仕事をしようとしている? –

答えて

1

dplyrパッケージの機能を使用することを検討してください。まずx、y、v、fがx軸、Likert、平均値を求める値、ファセットにそれぞれ対応する偽のデータセットを作成します。必要な値を作成

library(ggplot2) 
library(dplyr) 
n <- 1000 
set.seed(1) 
d <- data.frame(x = sample(0:1, n, r = T), 
       y = pmin(rpois(n, 2), 6), 
       v = rnorm(n), 
       f = sample(0:2, n, r = T)) 

dplyrからgroup_bysummariseを使用しての組み合わせです:

plt <- d %>% group_by(f, x, y) %>% 
    summarise(n = n(), v = mean(v)) 

最後に、プロット:

ggplot(plt, aes(x = factor(x), y = factor(y), size = n, colour = v)) + 
    geom_point() + 
    facet_wrap("f") 

enter image description here

+0

多くのおかげさま...プロット(factor(x))の各列のドットのサイズを、生のカウントではなく列のカウントの割合を反映させるにはどうしますか? – sautedman

+0

'dplyr'で比例を計算する方法については、この質問を参照してください:http://stackoverflow.com/questions/24576515/relative-frequencies-proportions-with-dplyr –

関連する問題