使用随机截距和斜率而不是每个主题的单独回归有什么区别?

机器算法验证 回归 混合模式 回归系数
2022-03-17 03:56:14

我已经录制了 20 名参与者的 DV 和 IV。IV 是重复测量,我的目标是了解 IV 的变化如何解释 DV 的变化。更具体地说,我想要每个参与者的 beta 系数。

我的第一个想法是为每个受试者建立一个具有随机截距和随机斜率的线性混合效应模型。但后来我问自己:为什么我不能只运行 20 个单独的普通线性回归(只有固定效应)?

我会用这两种方法得到相同的贝塔系数吗?如果不是,那么区别在哪里?

1个回答

有两个主要区别,彼此相关。

1)为每个主题运行单独的回归需要更多的自由度,因为您有一个截距和斜率来估计每个主题。

2)混合模型利用部分池化;随机效应向均值方向缩小。这基本上意味着来自其他主题的数据可以告知您对任何特定主题的参数的最佳估计。如果您单独拟合回归(或通过每个主题的固定效应),您可能会得到比使用随机效应更多的极端值。请注意,这种方法的实用性依赖于随机效应来自正态分布的假设,尽管我相信它对偏离它的偏差是稳健的。无论如何,这通常是一个合理的假设,但考虑在您的情况下它是否可能是正确的可能很有用。