机器算法验证 - 多元正态分布分布的度量 - 吾爱随笔录

机器算法验证正态分布多元分析

2022-03-08 05:37:02

什么是多元正态分布的良好传播度量？

我正在考虑使用组件标准偏差的平均值；也许是协方差矩阵的迹除以维数，或者它的一个版本。这有什么好处吗？

谢谢

3个回答

那么样本方差-协方差矩阵的行列式呢：测量向量的维空间内矩阵包围的平方体积的度量。此外，该度量的常用尺度不变版本是样本相关矩阵的行列式：在测量向量的维度内占据的空间体积。

我会选择跟踪或行列式，根据应用程序偏好跟踪。它们都很好，因为它们对表示不变并且具有清晰的几何含义。

我认为 Trace over Determinant 有一个很好的论据。

行列式有效地测量了不确定椭球的体积。但是，如果您的系统中有任何冗余，那么协方差将接近奇异（椭圆体在一个方向上非常薄），然后行列式/体积将接近于零，即使存在很多不确定性/传播在其他方向。在中等到高维环境中，这种情况经常发生

轨迹在几何上是轴长度的总和，并且对这种情况更加稳健。即使某些方向是确定的，它也将具有非零值。

此外，轨迹通常更容易计算。

另一个（密切相关的）量是分布的熵：对于多元高斯，这是协方差矩阵行列式的对数，或

$\frac{1}{2} \log |(2\pi e)\Lambda|$

在哪里 $\Lambda$ 是协方差矩阵。这种选择的优点是它可以与其他（例如，非高斯）分布下的点的“分布”进行比较。

（如果我们想获得技术，这是高斯的微分熵）。

其它你可能感兴趣的问题