线性混合效应模型 - 随机截距和斜率?可识别性问题

机器算法验证 混合模式
2022-04-15 18:40:35

我有一个关于为包含大约 5000 个主题的大型数据集构建模型的问题。我想拟合一个包含多个变量的 LMEM,并且我及时进行了重复测量。但是对于一些科目(大约 1200,意味着 <25%),我只有一个测量值。当拟合一个简单的 LMEM 时,这没有问题,因为数据集足够大,只包含一个随机截距。但是,在向模型添加随机斜率时,我最终遇到了可识别性问题和不收敛。所以我想知道什么更常见:删除仅提供一个测量值的受试者并估计具有随机截距和斜率的模型,或者保持总数据集不变并仅使用随机截距。

实际上关于固定效果的结果非常相似,但我想走正确和更标准的方式。我真的很想知道如何决定是只使用随机截距还是随机截距和斜率。

非常感谢!

1个回答

首先,我几乎总是建议不要出于任何原因删除观察结果,但在你的情况下,我绝对不建议这样做。通过删除观察结果,您会失去统计能力,但更重要的是,您可以引入偏差。

想一想拟合随机斜率意味着什么。这意味着您允许固定效果的斜率因主题而异。换句话说,每个主题都有自己的变量斜率。那么在一个对象只有一个观察值的情况下,它可能有什么斜率?为了使拟合斜率有意义,理想情况下您至少有 2 个观察值。混合模型对小集群大小是稳健的,但是当你有很大比例的单例集群时,拟合随机斜率是没有意义的。