我将描述您的每个调用lmer()
适合什么模型以及它们有何不同,然后回答您关于选择随机效应的最后一个问题。
您的三个模型中的每一个都包含 的固定效应practice
,context
以及两者之间的相互作用。模型之间的随机效应不同。
lmer(ERPindex ~ practice*context + (1|participants), data=base)
包含由具有相同值的个体共享的随机截距participants
。也就是说,每个participant
的回归线都向上/向下移动一个随机量,平均值。0
lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)
该模型除了随机截距外,还包含 中的随机斜率practice
。这意味着个人从实践中学习的速度因人而异。如果一个人具有正的随机效应,那么他们在练习中的增长速度比平均水平要快,而负的随机效应表明他们在练习中的学习速度低于平均水平,或者可能在练习中变得更糟,这取决于随机变量的方差效果(这是假设练习的固定效果是积极的)。
lmer(ERPindex ~ practice*context + (practice|participants) +
(practice|participants:context), data=base)
该模型适合随机斜率和截距practice
(您必须(practice-1|...)
抑制截距),就像之前的模型一样,但现在您还在因子中添加了随机斜率和截距participants:context
,这是一个新因子,其水平是 和 中存在的水平的每个组合,participants
并且context
相应的随机效应由具有相同值的观察共享participants
和context
。为了拟合这个模型,您需要有多个观测值,它们的值相同,participants
并且context
否则模型不可估计。在许多情况下,由该交互变量创建的组非常稀疏,并导致非常嘈杂/难以拟合随机效应模型,因此在使用交互因子作为分组变量时要小心。
基本上(阅读:不要太复杂)当您认为分组变量定义数据集中不均匀性的“口袋”或共享分组因子水平的个体应该相互关联时(而不应该相关的个体) - 随机效应实现了这一点。如果您认为观察值共享两者的水平participants
并且context
比两部分的总和更相似,那么包括“交互”随机效应可能是合适的。
编辑:正如@Henrik 在评论中提到的,您适合的模型,例如:
lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)
使随机斜率和随机截距彼此相关,并且该相关性由模型估计。要约束模型以使随机斜率和随机截距不相关(因此是独立的,因为它们是正态分布的),您应该拟合模型:
lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants),
data=base)
这两者之间的选择应该基于您是否认为,例如,participant
具有比平均值更高的基线(即正随机截距)的 s 也可能具有比平均值更高的变化率(即正随机斜率)。如果是这样,您将允许两者相关,而如果不是,则将它们限制为独立的。(同样,这个例子假设固定效应斜率为正)。