MCMC 贝叶斯方法 - 居中和标准化

机器算法验证 回归 贝叶斯 马尔可夫链蒙特卡罗
2022-03-17 07:38:33

为什么在贝叶斯方法 (MCMCregress) 中通常推荐居中和标准化?

它是否同样适用于非信息性和信息性先验?

编辑: 我们一直在研究一个具体的例子。以下屏幕截图提供了 R 输出的摘要。居中和标准化是否改善了预测?参数集中和标准化后将如何解释?

mcmc.logmod <- MCMCregress(log(Salary) ~ AtBat + Hits + HmRun, data = red.hitters,
                           family = gaussian, burnin = 1000, mcmc = 10000, verbose = 0)
summary(mcmc.logmod)
plot(mcmc.logmod, col = "brown")

在此处输入图像描述

居中标准化:

mcmc.logmod2 <- MCMCregress(salary ~ atbat + hits + hmrun, data = sub.hitters, family = gaussian,
                            burnin = 1000, mcmc = 10000, verbose = 0)
summary(mcmc.logmod2)

在此处输入图像描述

1个回答

均值居中或标准化仅用于提高 MCMC 采样的效率(即,减少链中的自相关)。原则上,没有必要表示中心(或标准化),但是您必须等待更长的时间才能使链产生合理的有效样本量。(不能保证均值居中或标准化对所有应用都有帮助,但它往往会有所帮助。)

均值居中或标准化不会改变参数估计。但是,您必须转换回原始比例。

DBDA2E中详细介绍了这方面的细节对于线性回归,请参阅第 17.2.1.1 节(第 485+ 页)。对于二次趋势,第 17.4 节(第 495 页)。对于多元线性回归,第 18.1.2 节(第 516 页)。对于逻辑回归,第 21.1.1 节(第 624-625 页)。