拟合的线性混合效应模型如何预测新受试者的纵向输出?

机器算法验证 混合模式 预测模型 随机效应模型
2022-03-29 01:15:14

我使用 nlme 包为艾滋病数据集拟合了一个线性混合效果模型。

图R中的AIDS数据集,CD4为CD4细胞计数,obstime为观察时间,患者为患者id

这里,CD4 是 CD4 细胞计数,obstime 是观察时间,患者是患者 id。

我的线性混合效应模型如下所示:

lmeFIT <- lme(CD4 ~ obstime, random = ~ 1|patient, data=aids_train)

我已将我的数据集拆分为训练和测试集,其中,我的测试集由来自 2 个科目的数据组成,训练集由来自其余科目的数据组成。上面显示的模型适合训练数据集中不同患者的随机截距现在,我的问题是

  1. 拟合模型后,混合效应模型如何准确预测我的测试数据集中新患者 ID 的输出?
  2. 我在网上看到的所有示例都表明,使用混合效应模型,我们可以为训练数据集中的每个主题绘制具有不同截距的拟合线。但是,我们如何知道测试数据集中的新数据集的截距是多少?对此有何数学解释?
2个回答

只要您有至少一个新患者的数据点,您就可以计算个性化(动态)预测。

特别要说yjo表示新患者的观察结果数据j,那么你可以先得到一个估计值,比如说bj他/她的后验分布的随机效应[bjyjo,θ], 在哪里θ表示模型参数。例如,bj是这个后验分布的平均值。鉴于对他/她的随机效应的估计,您可以使用xj(t)β+zj(t)bj, 在哪里xj(t)zj(t)表示在(未来)感兴趣的时间点的固定和随机效应的设计矩阵,和β表示固定效应。这些预测的标准误差可以使用蒙特卡洛方案获得。

对于您安装的模型,您可以使用JMbayes包中的lme()函数获得这些预测如果您有分类纵向数据,您可以使用GLMMadaptive包的函数拟合模型的方法获得相同类型的个性化预测;有关后者的更多信息,您还可以查看小插图IndvPred_lme()predict()mixed_model()

受试者的随机截距表示与平均人口水平响应的偏差。在预测新主题时,拟合的随机效应没有帮助;这是因为没有办法先验地知道该受试者的模式如何偏离人口水平的反应。相反,对任何新主题的最佳预测将是人口反应本身。

编辑:这里的两个答案之间没有矛盾。@DimitrisRizopoulos 假设您有一些关于新患者的信息,即至少一次测量。相反,我假设您没有新患者的测量值 - 在这种情况下,人口反应是任何新患者的最佳预测。