2016-10-13 4 views
0

混合エフェクトモデル(lme4パッケージ)を使用して、Rでシミュレートされたいくつかの縦方向データを分析しようとしています。混合エフェクトモデルによる縦方向データの分析R

模擬データ:25人の被験者は5つの連続する時点で2つのタスクを実行しなければならない。

#Simulate longitudinal data 
N <- 25 
t <- 5 
x <- rep(1:t,N) 

#task1 
beta1 <- 4 
e1 <- rnorm(N*t, mean = 0, sd = 1.5) 
y1 <- 1 + x * beta1 + e1 

#task2 
beta2 <- 1.5 
e2 <- rnorm(N*t, mean = 0, sd = 1) 
y2 <- 1 + x * beta2 + e2 

data1 <- data.frame(id=factor(rep(1:N, each=t)), day = x, y = y1, task=rep(c("task1"),length(y1))) 
data2 <- data.frame(id=factor(rep(1:N, each=t)), day = x, y = y2, task=rep(c("task2"),length(y2))) 
data <- rbind(data1, data2) 

Question1:被験者が各タスクを学習方法を分析するには? ranef(m1)

library(lme4) 
m1 <- lmer(y ~ day + (1 | id), data=data1) 
summary(m1) 

... 
Fixed effects: 
      Estimate Std. Error  df t value Pr(>|t|)  
(Intercept) 1.2757  0.3561 123.0000 3.582 0.000489 *** 
day   3.9299  0.1074 123.0000 36.603 < 2e-16 *** 

私は、各被験者のためのランダム切片を取得し、私は、日= 1で各被験者のベースライン値を反映している。しかし、私は、個々のタスクを学習どのように伝えることができる方法を理解していないと思われまたは被験者がどのようにタスクを習得するかが異なるかどうかを判断する。

質問2:タスク1とタスク2で学習する方法が異なるかどうかを分析するにはどうすればよいですか。

答えて

2

あなたの質問に簡単に答えたいと思っていますが、第15章のSnijders & Bosker (2012)またはSinger & Willet (2003)の書籍を読むことをお勧めします。日は、パネルデータがある(つまり、誰もが同じ日に測定されている)ように見えるモデルでは連続変数として扱われ、異なる測定時を示すこと以外は意味がありません。日を要因として扱うほうが良いかもしれません(すなわち、ダミー変数を使用する)。 しかし、今のところ私はあなたの例を続行します

最初のモデル(私はあなたがdata1のデータを欲しいと思うと思います)は、一定の線形勾配(平均勾配、仕事の差はなく、個人差なし)を与えます。一定のインターセプトは、0が0のときのパフォーマンスです。意味がありません。そのため、より良い解釈(または実際にはダミーを使用)のために、その日の効果を中央に置くことを検討するとよいでしょう。ランダムな効果は、あなたの例では推定差異が0.00であるこの切片からの個々の逸脱を与え、個人は開始位置において互いにほとんど違いがない。

m1 <- lmer(y ~ day + (1 | id), data=data) 
summary(m1) 
Random effects: 
Groups Name  Variance Std.Dev. 
id  (Intercept) 0.00 0.000 
Residual    18.54 4.306 
Number of obs: 250, groups: id, 25 

このモデルを拡張するには、タスクとの対話を追加します。固定傾きが、私は(あなたも、あなたのモデルを更新するためにupdate()を使用することができます)と信じて、質問2の答えタスク1とタスク2のために異なっていることを意味

m2 <- lmer(y ~ day*task + (1|id), data = data) 
summary(m2) 

このモデルでは、一日の効果は、あなたの参照カテゴリの固定傾きであります(task1)、相互作用はtask1とtask2の傾きの差です。タスクの固定効果は、切片の違いです。 モデルフィットは、偏差テストで評価できます。MLおよびREML推定の説明については、Snijders & Boskers(2012)を参照してください。

anova(m1,m2) 

ランダム効果は、傾きと切片内の個々の偏差を示し、質問1

m3 <- lmer(y ~ day*task + (day|id), data = data) 
summary(m3) 
ranef(m3) 

に答えている、我々は再びモデルを更新することができ、個人の成長のためのランダムな効果を追加します。あなたのランダムな効果の分布の概要はモデルの要約に含まれています(m1と同じです)。 最後に、タスク1とタスク2でパフォーマンスの成長が異なるかどうかを判断するために、日常業務とのやりとりにランダムな効果を加えることができると思います。しかしこれはあなたのデータと以前のモデルのパフォーマンスに大きく依存します。

m4 <- lmer(y ~ day*task + (day*task|id), data = data) 
summary(m4) 
ranef(m4) 

これが役立ちます。私が推薦する本は確かにすべきである。どちらも優れた例と理論の説明を提供します(残念なことにRの例はありません)。固定された機会モデル(ダミーによって表現される1日の効果)を決定すると、nlmeパッケージはランダム効果の共分散構造を制御する優れたオプションを提供します。パッケージのドキュメントはPinheiro & Bates (2000)で提供されています。

関連する問題