在总结一维连续分布(例如后验分布)时,通常使用等尾区间(也称为基于分位数)或最高密度区间。95% 等尾区间在概念上对应于中位数,因为当区间的覆盖范围收敛到中位数时。以同样的方式,最高密度区间对应于模式,因为模式是最高密度的点。但是连续分布的另一个流行点总结是平均值,我的问题是:
对应于均值的区间是多少?
那是:
- 那个区间叫什么?
- 它是如何定义/计算的?
如果有人对这个难题发表评论,为什么平均值是一种非常流行的总结分布的方式,而相应的区间却不那么流行(就像我的印象一样)。
在总结一维连续分布(例如后验分布)时,通常使用等尾区间(也称为基于分位数)或最高密度区间。95% 等尾区间在概念上对应于中位数,因为当区间的覆盖范围收敛到中位数时。以同样的方式,最高密度区间对应于模式,因为模式是最高密度的点。但是连续分布的另一个流行点总结是平均值,我的问题是:
对应于均值的区间是多少?
那是:
如果有人对这个难题发表评论,为什么平均值是一种非常流行的总结分布的方式,而相应的区间却不那么流行(就像我的印象一样)。
我不知道以平均值为中心的区间是否有一个特殊的名称,但我可以想到不止一种方法可以定义以平均值为中心的区间,因为区间将收敛到平均值作为宽度inverval 的值变为零。最简单的可能是区间 其中是均值,成立的最小值 .
更一般地说,可以将平均居中区间定义为 其中和是正数,并通过某种程序选择,使得该区间再次具有所需的可信度。
但是,我认为有充分的理由主要考虑最高密度区域和等尾区间。引用 Christian Robert(贝叶斯选择):
仅考虑 HPD [最高后验密度] 区域是因为它们最小化了可信区域之间的体积,因此可以将其设想为决策设置中的最佳解决方案。
最高密度区域不一定是连接区间,例如,当分布是多峰时,可能会发生这种情况。对此,罗伯特写道:
当 (...) 置信区域未连接 (...) 时,通常的解决方案是将 HPD可信区域替换为等尾区间。