给定具有维度的多元正态分布计算最高密度区域dd> 3

机器算法验证 贝叶斯 正态分布 多元分析 可信区间 最高密度区
2022-03-29 14:29:58

背景

假设我有一个单峰对称的维度分布d> 3 例如多元正态分布 ~ N(0, H),其中 H 是已知的d维协方差矩阵。

问题

我有兴趣找到覆盖此分布下 95% 区域的最高密度区域。现在,我了解了单变量和双变量情况下最高密度区域的概念,以及如何使用hdrcde包来获取这些区域。但是,我对以下内容感兴趣:在给定多元正态分布假设和d维协方差矩阵 H 其中d=10 例如?

想法如何进行

我知道,在单峰对称分布的情况下,例如问题中考虑的多元正态分布,α% HDR 与α% 分布的分位数。例如,我可以使用基于网格的算法来近似这些分位数。这个想法是为每个维度定义 M 个网格点,以便覆盖相关空间。这将导致 M^d联合网格值d维分布。然后我将评估每个联合网格点的多元法线密度的 pdf。然后从这个 M^d密度网格我不知道如何进行以获得α-分位数。

任何关于如何进行的建议都非常受欢迎。如何获得高密度区域的任何其他方法d维正态分布d>2也非常受欢迎,因为我认为 M^d函数评估在更高维度上可能会变慢。提前谢谢你。

1个回答

密度最高的区域N(0,H)随机变量是以均值为中心的椭球体,0, 并根据协方差矩阵定向H. 椭球的截止值可以从卡方确定d自由程度。

y=值使得卡方与d自由程度0.95. 然后是最高密度区域捕获0.95的概率N(0,H)

x:xTH1xy

例如,当d=10,y=18.307038.