在 lmer 中指定多少个随机效应?

机器算法验证 r 混合模式 重复测量 lme4-nlme
2022-03-11 18:12:43

我进行了一项基于计算机的实验,其中有两个主体内因素 A 和 B。所以所有参与者在每个 A*B 细胞中都进行了多次试验。主题因素之间也有一个,C.

我试图预测响应时间,所以最初我做了:

> lmer(rt ~ A*B*C + (1|subj)

但被告知我也应该指定随机效应交互,例如:

> lmer(rt ~ A*B*C + (1|subj) + (1|A:subj) + (1|B:subj)

那样的话,我是不是也应该指定三向交互呢?例如:

> lmer(rt ~ A*B*C + (1|subj) + (1|A:subj) + (1|A:B:subj)

我了解第一个模型,但我不太清楚其他两个模型——尽管它们都提供不同的结果。有人可以澄清这些模型的作用以及最合适的模型吗?

2个回答

当您在模型中指定随机效应时lme4::lmer,随机因子位于管道左侧,非独立分组变量位于右侧,因此您问题中完全指定的模型很可能是:

lmer(rt ~ A*B*C + (A*B|subj))

我花了一些时间来探索管道左侧的随机效应与管道右侧的随机效应之间的区别,但它本身比作为您特定问题的答案更好。

RPubs 文档

要点代码

以下两种型号之间最明显的区别...

lmer(rt ~ A + (1|subj/A))
lmer(rt ~ A + (A|subj))

...是后者估计随机截距和随机斜率之间的随机相关参数。如果您删除该随机相关参数...

lmer(rt ~ A + (1|subj/A))
lmer(rt ~ A + (1|subj) + (0+A|subj))

...这两个模型返回完全相同的固定效应(参数估计和相关误差),尽管我猜想相似性取决于研究的特定设计。

关于哪种模型最合适的问题,我仍在为自己学习,但我可以推荐一篇涵盖该主题的优秀论文:

Barr、DJ、Levy R.、Scheepers C.、Tily HJ。(2013) 验证性假设检验的随机效应结构:保持最大,记忆和语言杂志 68 (2013) 255–278

正如标题所暗示的那样,底线是您应该始终尝试包含最大随机效应结构,因为只有这样才能保证您不会夸大 I 类错误(这也是关于随机截距和斜率在回归中的作用的优秀教程模型)。

然而,有时复杂的随机效应结构会导致模型收敛问题。这就是为什么一些研究人员提出了一种不太激进的方法,并建议您应该保留由数据证明的最大随机效应结构(即您测试随机效应是否通过使用 anova() 来改善模型拟合并将其剥离到显着仅随机效应)。Florian Jaeger 在他的优秀博客中讨论了这个问题:

http://hlplab.wordpress.com/2009/05/14/random-effect-structure/ http://hlplab.wordpress.com/2011/06/25/more-on-random-slopes/