什么是与平均值相关的区间,因为等尾区间与中位数相关,而最高密度区间与众数相关?

机器算法验证 意思是 后部 中位数 模式 可信区间
2022-03-27 01:39:54

在总结一维连续分布(例如后验分布)时,通常使用等尾区间(也称为基于分位数)或最高密度区间。95% 等尾区间在概念上对应于中位数,因为当区间的覆盖范围收敛到中位数时。以同样的方式,最高密度区间对应于模式,因为模式是最高密度的点。但是连续分布的另一个流行点总结是平均值,我的问题是:0%

对应于均值的区间是多少?

那是:

  • 那个区间叫什么?
  • 它是如何定义/计算的?

如果有人对这个难题发表评论,为什么平均值是一种非常流行的总结分布的方式,而相应的区间却不那么流行(就像我的印象一样)。

1个回答

我不知道以平均值为中心的区间是否有一个特殊的名称,但我可以想到不止一种方法可以定义以平均值为中心的区间,因为区间将收敛到平均值作为宽度inverval 的值变为零。最简单的可能是区间 其中是均值,成立的最小值 .

C=(μk,μ+k),
μkP(xC)1α

更一般地说,可以将平均居中区间定义为 其中是正数,并通过某种程序选择,使得该区间再次具有所需的可信度。

C=(μa,μ+b),
ab

但是,我认为有充分的理由主要考虑最高密度区域和等尾区间。引用 Christian Robert(贝叶斯选择):

仅考虑 HPD [最高后验密度] 区域是因为它们最小化了可信区域之间的体积,因此可以将其设想为决策设置中的最佳解决方案。α

最高密度区域不一定是连接区间,例如,当分布是多峰时,可能会发生这种情况。对此,罗伯特写道:

当 (...) 置信区域未连接 (...) 时,通常的解决方案是将 HPD可信区域替换为等尾区间。α