混合模型。仅随机斜率,均值和组居中?

机器算法验证 混合模式 随机效应模型 固定效应模型 群体差异
2022-03-23 15:20:59

随机截距是随机斜率的理论/实践先决条件吗?为什么?

我有一个三级(代表测量)混合模型,我不希望结果变量的初始状态出现 lvl 3 变化。也就是说,患者被随机分配给医生,因此他们不应该是医生之间 DV 平均值的变化(所有人都有相同的机会获得初始 DV 高和低的患者)。

患者的截距存在差异,这是可以的。

问题是,是否允许仅 3 级的随机斜坡模型。我看到的每个示例总是先随机截取。这是因为它必须还是因为我只是因为例子不走运?

另外,有谁知道主题/ID变量的不同数值结构如何影响混合模型?ID。两个级别都有一个唯一标识符与在 2 级(个人)的每个组中都有一个唯一标识符。

另外,有人可以解释一下以均值为中心和以群体为中心的 DV 背后的好处、原因和区别吗?

希望这足够清楚,可以讨论。谢谢

3个回答

这一切都取决于您的学习性质。

当您拟合没有随机斜率的随机截距时,这假定每个受试者对治疗具有相同的反应,但每个受试者具有不同的基线值:

在此处输入图像描述

当您添加随机斜率时,您允许每个受试者对治疗有不同的反应,并且每个受试者仍然具有不同的基线值:

在此处输入图像描述

如果您不适合随机截距,但保留斜率,那么您假设每个受试者对治疗有不同的反应,并且每个受试者具有相同的基线值:

在此处输入图像描述

问题是,是否允许仅 3 级的随机斜坡模型。我看到的每个示例总是先随机截取。这是因为它必须还是因为我只是因为例子不走运?

是的,这当然是允许的,但正如@Wayne 答案中的图表所示,它假设基线观察值在该水平上是相等的。

有谁知道主题/ID变量的不同数值结构如何影响混合模型?ID。两个级别都有一个唯一标识符与在 2 级(个人)的每个组中都有一个唯一标识符。

这将取决于您用于拟合模型的软件以及您指定模型的方式。lme4例如,在R 中,只要您正确指定随机截距,它就不会有任何区别。有关更多信息,请参阅答案和答案。

有人可以解释以均值为中心和以群体为中心的DV背后的好处,原因和区别吗?

出于解释目的,通常需要大均值居中,尤其是在涉及交互时,其中主效应显示协变量的影响,而另一个协变量(在双向交互的情况下)保持为零(这通常是在现实世界的情况下不可信)。在组均值居中的情况下,随机截距将是未调整的组均值。然后可以将组均值用作组级预测器,并且该预测器的系数将是组间预测器。就我个人而言,我从未发现需要进行组均值居中 - 尽管我已经看到它完成了,特别是在多级建模文献中。

关于某些方面的经典必读书籍是 Bill Venables(Ripley/Venables 的 Jekyll 子集)https://www.stats.ox.ac.uk/pub/MASS3/Exegeses.pdf

作为固定零偏移量可能有用的罕见示例:假设您在一些手术后测量“新骨生长”。根据定义,新骨在手术时正好为零,后来它被测量并变化。