当您将一组牙体可视化为 Fisher 度量张量内的流形时,KL 具有深刻的含义,它给出了两个“接近”分布之间的测地线距离。正式地:
ds2=2KL(p(x,θ),p(x,θ+dθ))
以下几行将详细解释这个 las 数学公式的含义。
Fisher 度量的定义。
考虑一个参数化的概率分布族中的密度给出),其中是随机变量,theta 是中的参数。大家可能都知道 Fisher 信息矩阵是D=(f(x,θ))RnxRpF=(Fij)
Fij=E[d(logf(x,θ))/dθid(logf(x,θ))/dθj]
使用这种表示法是黎曼流形,是黎曼度量张量。(这个度量的兴趣由 cramer Rao 下界定理给出)DF(θ)
你可能会说……好的数学抽象,但是 KL 在哪里?
这不是数学抽象,如果你真的可以把你的参数化密度想象成一条曲线(而不是无限维空间的子集)并且连接到该曲线的曲率......(见Bradley Efron 的开创性论文http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176343282 )p=1F11
您问题中点 a/ 部分的几何答案:流形上两个(接近)分布和之间的平方距离(想想地球上距离很近的两点的测地线距离,它与地球的曲率有关)由二次形式给出:ds2p(x,θ)p(x,θ+dθ)
ds2=∑Fijdθidθj
并且已知是 Kullback Leibler Divergence 的两倍:
ds2=2KL(p(x,θ),p(x,θ+dθ))
如果您想了解更多信息,我建议阅读 Amari
http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176345779的论文
(我认为 Amari 也有一本书关于统计学中的黎曼几何,但我不记得名字了)