多元正态分布分布的度量

机器算法验证 正态分布 多元分析
2022-03-08 05:37:02

什么是多元正态分布的良好传播度量?

我正在考虑使用组件标准偏差的平均值;也许是协方差矩阵的迹除以维数,或者它的一个版本。这有什么好处吗?

谢谢

3个回答

那么样本方差-协方差矩阵的行列式呢:测量向量的维空间内矩阵包围的平方体积的度量。此外,该度量的常用尺度不变版本是样本相关矩阵的行列式:在测量向量的维度内占据的空间体积。

我会选择跟踪或行列式,根据应用程序偏好跟踪。它们都很好,因为它们对表示不变并且具有清晰的几何含义。

我认为 Trace over Determinant 有一个很好的论据。

行列式有效地测量了不确定椭球的体积。但是,如果您的系统中有任何冗余,那么协方差将接近奇异(椭圆体在一个方向上非常薄),然后行列式/体积将接近于零,即使存在很多不确定性/传播在其他方向。在中等到高维环境中,这种情况经常发生

轨迹在几何上是轴长度的总和,并且对这种情况更加稳健。即使某些方向是确定的,它也将具有非零值。

此外,轨迹通常更容易计算。

另一个(密切相关的)量是分布的熵:对于多元高斯,这是协方差矩阵行列式的对数,或

12log|(2πe)Λ|

在哪里Λ是协方差矩阵。这种选择的优点是它可以与其他(例如,非高斯)分布下的点的“分布”进行比较。

(如果我们想获得技术,这是高斯的微分熵)。