分位数区间与最高后验密度区间

机器算法验证 分布 贝叶斯 分位数 密度函数 可信区间
2022-03-31 07:00:43

我正在阅读一些有关贝叶斯分析的内容,但我无法理解经典的基于分位数的区间和最高后密度区间之间的区别。两者有什么区别?我已经模拟并绘制了一些数据,Q95% 和 95% HPDI 似乎相似但不完全相同。是否存在差异较大的情况?非常感谢

2个回答

对于单峰、或多或少的对称分布,基于 HPD 和分位数的可信区间不会有太大差异。但是考虑具有良好分离模式的双峰后验分布:基于 HPD 的可信区域将是两个不相交的区间,而基于中心分位数的可信区域是构造的单个区间。

从决策理论的角度来看,两种不同的区间对应于两种不同的损失函数。最大的区别在于 HPD 对应的损失函数包括对可信区域长度的惩罚。(嗯,不,正如客人隐含地指出的那样,它是)如果区间未能覆盖真实值,则基于分位数的可信区间的损失函数会惩罚你的错误程度,而在 HPD 区间的损失函数中,“一念不如千里”。

一个简单的例子是,如果您购买的灯泡的使用寿命呈指数分布,平均为 1000 天。

对于 95% 的可信区域:您会倾向于认为它可能持续 25 到 3689 天(基于 0.025 和 0.975 的分位数),还是认为它可能持续少于 2996 天(基于最高密度区间)?

换句话说,如果它几乎一买就死了,即使分布模式为零,你会感到惊讶吗?