基于 MCMC 的回归模型中的残差诊断

机器算法验证 r 贝叶斯 混合模式 马尔可夫链蒙特卡罗 残差
2022-01-19 03:59:26

我最近开始在贝叶斯框架中拟合回归混合模型,使用 MCMC 算法(实际上是 R 中的函数 MCMCglmm)。

我相信我已经了解如何诊断估计过程的收敛性(迹线、geweke 图、自相关、后验分布......)。

在贝叶斯框架中让我印象深刻的一件事是,似乎投入了大量精力来进行这些诊断,而在检查拟合模型的残差方面似乎做得很少。例如,在 MCMCglmm 中,residual.mcmc() 函数确实存在,但实际上尚未实现(即返回:“MCMCglmm 对象尚未实现残差”;predict.mcmc() 的情况相同)。其他软件包似乎也缺少它,而且在我发现的文献中更普遍地很少讨论(除了 DIC,它也被大量讨论)。

谁能指出一些有用的参考资料,以及我可以使用或修改的理想 R 代码?

非常感谢。

1个回答

我认为残差一词的使用与贝叶斯回归不一致。请记住,在频率论概率模型中,参数被认为是固定的可估计量,并且数据生成机制具有一些与观察数据相关的随机概率模型。对于贝叶斯,概率模型的参数被认为是可变的,固定数据更新了我们对这些参数是什么的信念。因此,如果您在回归模型中计算观察到的减去拟合值的方差,则观察到的分量将具有 0 方差,而拟合分量将作为模型参数的后验概率密度的函数而变化。这与您从频率回归模型中得出的结果相反。我认为如果有人有兴趣检查他们的贝叶斯回归模型的概率假设,参数估计的后验密度(根据我们的 MCMC 采样估计)与正态分布的简单 QQ 图将具有类似于分析残差(或 Pearson 残差)的诊断能力对于非线性链接函数)。