Wasserstein 距离与 KL 散度之间的关系(相对熵)

机器算法验证 分布 距离 kullback-leibler 瓦瑟斯坦
2022-03-28 21:37:35

考虑一阶的 Wasserstein 度量W1(又名地球移动距离)。我想知道是否可以链接W1和 Kullback-Leibler 散度(又名相对熵)以及这在直觉上意味着什么。我再也找不到它了,但如果我没记错的话,以下内容适用于某些常数C

W1(μ,ν)CKL(ν||μ),

在哪里KL是 KL 散度。我的第一个问题是:上述不等式是真的吗?其次,应该如何解释这一估计?

2个回答

这篇文章给出了一系列距离的不等式,包括总变化

12dTV(ν,μ)<KL(ν,μ)
这表示Wasserstein 距离受总变化距离的限制
2W1(ν,μ)CdTV(ν,μ)
如果度量是有界的C.

在另一个方向上没有简单的界限,因为您可以通过将概率从任意小点移动到相邻区域来使 KL 散度无限,这可以通过任意小来完成W1距离。例如,取两个标准法线。对于其中之一,将密度设置为零[0,ϵ]并且是现有值的两倍[ϵ,0]. 对另一个做相反的事情。Wasserstein 距离与ϵ,但 KL 散度是无限的。

正如在上一篇文章中指出的那样,这种不平等一般来说是不正确的。然而,已经有很多关于这些措施的研究μ对于所有措施都是如此ν. 最突出的是,这适用于标准正态分布。
这些估计属于“塔拉格兰不等式”。看看 Otto 和 Villani 的论文并在其中引用:http ://cedricvillani.org/sites/dev/files/old_images//2012/08/014.OV-Talagrand.pdf