是否存在多高斯版本的马氏距离?

机器算法验证 分布 距离
2022-04-02 01:00:26

假设我们在一个维空间中,并且我们有大量数据。这个维点云的分布可以通过多元高斯混合模型(使用 EM 算法估计)来建模。NN

现在,给定数据集中的两个数据点,在给定全局分布的情况下,我可以使用哪个距离来评估这两个点的接近度?xy

在单个高斯的情况下,我认为马氏距离是一个自然的选择,但是当已知全局分布是非高斯分布并且使用 GMM 对数据进行建模时,我们最终会得到个不同的协方差矩阵(每个高斯一个)。我是否应该计算 Mahlanobis 距离(每个协方差矩阵一个),然后使用高斯的后验概率进行加权求和?可能是这样的:KK

dist(x,y)=i=1Kγi(x)+γi(y)2(xy)TΣi1(xy)

其中是第个高斯是向量关于高斯的后验概率。Σiiγi(x)xi

有什么建议么 ?谢谢 !

2个回答

经过一番研究,我找到了我正在寻找的东西,一篇名为“Deriving cluster analytic distance functions from gaussian blend models”的论文提出了在多模态数据(GMM 表示)的上下文中使用 Fisher 扩展 Mahalanobis 距离内核方法和其他技术。