混合效应模型中预测值周围的置信区间意味着什么?

机器算法验证 r 置信区间 混合模式 重复测量 sas
2022-03-10 22:44:49

我在看这个页面并注意到 R 中 lme 和 lmer 的置信区间方法。对于那些不了解 R 的人,这些是用于生成混合效果或多级模型的函数。如果我在重复测量设计之类的东西中具有固定效应,那么预测值(类似于平均值)的置信区间意味着什么?我可以理解,对于效果,您可以有一个合理的置信区间,但在我看来,在此类设计中,围绕预测均值的置信区间似乎是不可能的。承认随机变量会导致估计中的不确定性这一事实可能非常大,但在这种情况下,在推论意义上比较不同值根本没有用。或者,

我在这里遗漏了什么还是我对情况的分析是否正确?... [并且可能是为什么它没有在 lmer 中实现的理由(但很容易在 SAS 中实现)。:)]

2个回答

它与任何其他置信区间具有相同的含义:在模型正确的假设下,如果反复重复实验和程序,则 95% 的时间感兴趣数量的真实值将位于区间内。在这种情况下,感兴趣的数量是响应变量的期望值。

在线性模型的背景下可能最容易解释这一点(混合模型只是对此的扩展,所以同样的想法适用):

通常的假设是:

yi=Xi1β1+Xi2β2+Xipβp+ϵ

其中是响应,是协变量,是参数,是均值为零的误差项。那么感兴趣的数量是:yiXijβjϵ

E[yi]=Xi1β1+Xi2β2+Xipβp

这是(未知)参数的线性函数,因为协变量是已知的(并且是固定的)。由于我们知道参数向量的采样分布,我们可以很容易地计算出这个量的采样分布(以及置信区间)。

那你为什么想知道呢?我想如果你在做样本外预测,它可以告诉你你的预测有多好(尽管你需要考虑模型的不确定性)。

也许这在贝叶斯框架中是有意义的。例如考虑单向随机效应方差分析模型: 以及总体均值和方差分量的先验分布。那么每个都有一个后验分布,这个分布的离散区间可以起到 “置信”区间的作用。

(yij|μi)N(μi,σw2),μiN(μ,σb2),
μσw2σb2μi95%95%