机器算法验证 - 什么是与平均值相关的区间，因为等尾区间与中位数相关，而最高密度区间与众数相关？ - 吾爱随笔录

什么是与平均值相关的区间，因为等尾区间与中位数相关，而最高密度区间与众数相关？

机器算法验证意思是后部中位数模式可信区间

2022-03-27 01:39:54

在总结一维连续分布（例如后验分布）时，通常使用等尾区间（也称为基于分位数）或最高密度区间。95% 等尾区间在概念上对应于中位数，因为当区间的覆盖范围收敛到中位数时。以同样的方式，最高密度区间对应于模式，因为模式是最高密度的点。但是连续分布的另一个流行点总结是平均值，我的问题是： $\rightarrow 0\%$

对应于均值的区间是多少？

那是：

那个区间叫什么？
它是如何定义/计算的？

如果有人对这个难题发表评论，为什么平均值是一种非常流行的总结分布的方式，而相应的区间却不那么流行（就像我的印象一样）。

1个回答

我不知道以平均值为中心的区间是否有一个特殊的名称，但我可以想到不止一种方法可以定义以平均值为中心的区间，因为区间将收敛到平均值作为宽度inverval 的值变为零。最简单的可能是区间其中是均值，成立的最小值 .

C = (μ - k, μ + k),

$C = (\mu-k, \mu+k),$

μ

$\mu$

k

$k$

P (x \in C) \geq 1 - α

$P(x\in C)\ge 1-\alpha$

更一般地说，可以将平均居中区间定义为其中和是正数，并通过某种程序选择，使得该区间再次具有所需的可信度。

C = (μ - a, μ + b),

$C = (\mu-a, \mu+b),$

a

$a$

b

$b$

但是，我认为有充分的理由主要考虑最高密度区域和等尾区间。引用 Christian Robert（贝叶斯选择）：

仅考虑 HPD [最高后验密度] 区域是因为它们最小化了可信区域之间的体积，因此可以将其设想为决策设置中的最佳解决方案。 $\alpha$

最高密度区域不一定是连接区间，例如，当分布是多峰时，可能会发生这种情况。对此，罗伯特写道：

当 (...) 置信区域未连接 (...) 时，通常的解决方案是将 HPD可信区域替换为等尾区间。 $\alpha$

其它你可能感兴趣的问题

上一篇这些术语在图像处理中的含义是什么？下一篇相关伯努利随机变量之和的正态近似