什么是最高密度区域 (HDR)?

机器算法验证 置信区间 估计 定义 可信区间 最高密度区
2022-02-13 00:12:51

统计推断中,问题 9.6b 中提到了“最高密度区域 (HDR)”。但是,我在书中没有找到这个术语的定义。

一个类似的术语是最高后密度 (HPD)。但它不适合这种情况,因为 9.6b 没有提到任何关于先验的内容。在建议的解决方案中,它只说“显然是 HDR”。c(y)

还是 HDR 是一个包含 pdf 模式的区域?

什么是最高密度区域 (HDR)?

3个回答

我推荐 Rob Hyndman 1996 年The American Statistician上发表的文章“计算和绘制最高密度区域”以下是 HDR 的定义,取自那篇文章:

为随机变量的密度函数。那么 HDR 是的样本空间使得 其中是最大常数,使得 f(x)X100(1α)%R(fα)X

R(fα)={x:f(x)fα},
fα
P(XR(fα))1α.

那篇文章中的图 1 说明了 75% HDR(所以)和其他各种 75% 概率区域之间的差异,用于混合两个法线(是第个分位数,是平均值,是密度的标准偏差):α=0.25cqqμσ

HDR

一维的想法是取一条水平线并将其向上移动(到),直到其上方和密度下方的区域为那么 HDR的投影。y=fα1αRαx

当然,所有这些都适用于任何密度,无论是贝叶斯后验还是其他。

这是 R 代码的链接,它是hdrcde包(以及 JSTOR 上的文章)。

对于某个给定的置信水平,最高后验密度 [区间] 基本上是后验密度上的最短区间。最高密度区域可能与应用于任何任意密度的想法相同,因此不一定是后验分布。

如果是你的置信水平,你总能找到两个分位数会给你一个工作区间。不过有一堆,它们都有不同的长度。你想要最短的。1αq1α/2+cqα/2c

如果您的密度是单峰的,那么最短的间隔将发生在两个分位数上,使得f()abf(a)=f(b)

海德曼 (1996):

  • 对于给定概率 1-α,覆盖样本空间的区域应具有尽可能小的体积。

  • 区域内的每个点的概率密度至少应与区域外的每个点一样大。

这些区域称为最高密度区域(HDR)

HDR 最独特的属性之一是概率覆盖的所有可能区域中,HDR 具有样本空间中可能的最小区域。“最小”是指一些简单的度量,例如通常的 Lebesgue 度量;在一维连续的情况下,这将是最短的间隔,而在二维的情况下,这将是表面的最小面积。在贝叶斯分析中,类似的方法称为最高后验密度区域 (HPD),后验密度用作度量。

HPD是贝叶斯统计中定义可信区间的方法之一。

可信区间是未观察到的参数值以特定概率落入的区间它是后验概率分布或预测分布域中的区间。对多元问题的概括是可信区域

可信区间在后验分布上不是唯一的。定义合适的可信区间的方法包括:

  • 选择最窄的区间,对于单峰分布,这将涉及选择那些具有最高概率密度的值,包括众数(最大后验)。这有时称为最高后验密度区间 (HPDI)
  • 选择低于该区间的概率与高于该区间的概率相同的区间。这个区间将包括中位数。这有时称为等尾区间
  • 假设均值存在,选择均值作为中心点的区间。