用于重复测量设计的线性混合效应模型的最大模型

机器算法验证 重复测量 lme4-nlme 混合模式
2022-04-03 15:44:52

我有一个包含两个主体内因素的心理实验数据集。为简单起见,假设我正在收集颜色(红色/蓝色/绿色)和形状(正方形/三角形)的刺激因素的反应时间 (RT)。我对主要影响和交互都感兴趣。

对于每个受试者,只有六个条件的平均 RT 可用(即每个受试者 6 个数据点)。传统上,此类数据集将通过具有两个因素的重复测量 ANOVA 进行分析。但是,许多观察结果随机缺失,因此我想改用混合效应模型。天真地将我理解的重复测量方差分析转换为混合效果术语,我得到(lmer 语法)

Y ~ color*shape + 1|subject

但是,我怀疑这个模型并不是这里所暗示的意义上的最大模型。我可以添加颜色和形状随机斜率:

Y ~ color*shape + color|subject + shape|subject + 1|subject

但是在这种离散水平因素的背景下,它们的含义和理由对我来说根本不清楚。

  1. 对于这个简单案例的正确最大模型以及为什么,或者至少对“为什么”提供有用的参考,我将不胜感激。

  2. 如果我要添加第三个 BETWEEN-subjects 因素(例如受试者的性别),那么建模是否需要不同的逻辑?

2个回答

首先我应该说,如果您的目标是制定一个完全类似于重复测量方差分析的混合模型,您还必须强制执行复合对称性,这lme将按如下方式完成

library(lmerTest)    
library(nlme)
fit=lme(Y~ color*shape, random=~1|subject, correlation=corCompSymm(form=~1|id),weights=NULL,data=data)
Y ~ color*shape + 1|subject
anova(fit)
summary(fit)

(您也可以使用一般相关结构来放松复合对称性的假设)

添加随机斜率lmer有时可以提高您的合身性,但并非总是如此。最好的方法是检查 Aikaike Information Criterion ( AIC(fit)),看看它是否真的比更简单的随机截取模型更好。

解释上的差异基本上是在随机截距模型中,您添加到模型中的所有内容都是每个受试者平均反应时间的随机变化。如果您添加随机斜率,那么这也将允许颜色和/或形状对反应时间的影响因受试者而异。另请注意,您可以允许相关或不相关的随机截距和斜率。

随机截距模型(1|受试者)将仅包括受试者平均反应时间的随机变化

相关截距和斜率模型 (color|subject) = (1+color|subject)将对每个受试者的反应时间产生颜色的随机影响(因此颜色对反应时间的影响因受试者而异)并且将包括每个受试者截距的相关估计(即每个受试者的平均反应时间不同,并且这种差异可能在某种程度上与对每种颜色的反应差异相关)

随机斜率模型 (0+color|subject) = (-1+color|subject)将允许颜色对反应时间的随机影响(因此颜色对反应时间的影响在受试者之间是不同的),但会强制所有受试者的平均截距相同(即,平均反应所有科目的时间都是相同的(如果您将这些作为固定术语包括在颜色和形状的影响之后,则在校正后))

最后,您还可以使用不相关的斜率和截距拟合随机斜率和截距模型, (1|subject) + (0+color|subject)因为这将允许对受试者进行随机截距(即,每个受试者的平均反应时间不同)并允许颜色对反应的影响的不相关随机变化每个受试者的时间(因此颜色对反应时间的影响因受试者而异)

所以我认为一个完整的模型将是 Y ~ color*shape + (color|subject) + (shape|subject)(具有相关的随机斜率和截距)或 Y ~ color*shape + (1|subject) + (0+color|subject) + (0+shape|subject)(具有不相关的随机斜率和截距)

不过,lme您仍然可以适应不同类型的相关性和方差结构。最好用来AIC比较那些的合身度。

最大结构还需要包括颜色和形状之间相互作用的随机效应,即:

Y ~ color * shape + (color + shape + color:shape | subject)

这将导致您的所有预测变量(颜色、形状及其相互作用)具有固定效应(所有受试者的常数)和随机效应(估计的固定效应周围的个体波动)。从这个意义上说,模型是最大的模型。请注意,它可能不完全等同于重复测量方差分析,因为它没有对相关结构做出同样严格的假设(参见汤姆的回答)。

如果公式的随机效应部分不包含交互作用,则交互作用效应中的个体差异不会被视为“随机”,模型将不等同于重复测量方差分析。当然,交互作用(或任何其他随机效应)的随机偏差的方差可能非常小,以至于将其包含在模型中并不会大大改善拟合。您不仅可以使用 AIC 来检查这一点,还可以使用似然比检验来检查这一点,因为具有与不具有随机效应的模型相互嵌套。原则上,如果似然比检验不显着,则意味着您可以安全地消除该随机效应。通过删除可忽略的组件来简化随机效应结构将是您链接的文章中所谓的数据驱动的一个示例方法。

您可以通过这种方式简化模型,它仍然等同于重复测量方差分析:

Y ~ color*shape + (1|subject) + (0+color|subject) + (0+shape|subject) + (0+color:shape|subject)

这种语法告诉lmer不要估计跨主题的随机偏差的相关性。这里的缺点是,例如,您将无法判断具有较大影响的受试者是否也color倾向于具有较大的影响shape(或较小的影响,在负相关的情况下)。

您可以轻松地包含一个主体间预测器,唯一的区别是您不能为其添加随机效应。例如,“性别”不能具有根据主题分组的随机效果,但它可以与其他固定效果相互作用,例如:

Y ~ color * shape * gender + (color + shape + color:shape | subject)