2016-07-21 7 views
0

Plot of Reads vs Gelscores平均値はゲルコアの順列ごとに読み取られますか?複数の変数に基づいて値の平均を見つける

私は現在私の大学の遺伝学研究室で働いています。私は現在コンピューター研究室でデータ解析を行っています。 PCRを行った後、我々はバンド、スミア、プライマー二量体、および非特異的生成物に従ってゲルを採点した。これらの変数は0,1または2の値しか割り当てられませんでした。私は4つのゲルスコアの各組み合わせに対して返された平均読み取り回数(シーケンシング結果)を見つけようとしています。各変数は、データシートに独自の列を持ちます。

データシート: バイアルID、バンド、スミア、Primer.Dimer、Non.Spec、

Exが読み込みます。ゲル= 0、スメア= 0、PrimerDimer = 0 NonSpec = 0の場合の平均読み取り回数。

Ex。ゲル= 0、スメア= 1、PrimerDimer = 1 NonSpec = 2の場合の平均読み取り回数。

任意の提案をいただければ幸いですが、 はあなたが

私は、一般的なプロット機能を使用してこのデータをプロットすることができますありがとうございます。平均棒が表示されていますが、私はそれらの値を確認することはできません。

"プロット(読み込み〜as.factor(データシート$バンド+(Primer.Dimer * 10)+(スミア* 100)+(Non.Specific.Product * 1000))"

答えて

0

あなたは使ってこれを行うことができますdplyrとtidyrパッケージ:これは、ゲルスコアの組み合わせごとに一意のグループIDを作成するためにtidyrのunite機能を使用しています

library(dplyr) 
    library(tidyr) 

    set.seed(14592) 

    df <- data.frame(
     vial_id  = 1:10, 
     band   = sample(0:2, 10, replace = TRUE), 
     smear  = sample(0:2, 10, replace = TRUE), 
     primer_dimer = sample(0:2, 10, replace = TRUE), 
     non_spec  = sample(0:2, 10, replace = TRUE), 
     reads  = rnorm(10) 
    ) 

    df %>% 
     unite(group_id, band:non_spec, remove = FALSE) %>% 
     group_by(group_id) %>% 
     summarize(group_mean = mean(reads)) 

は、グループごとに読み平均値を見つけるために、dplyrのgroup_bysummarize機能を使用しています

関連する問題