KL 分歧和预期

机器算法验证 期望值 kullback-leibler
2022-03-28 23:38:14

我试图理解下面对 KL 散度的解释。据我了解,它指的是对第二个任期的期望。“在这个术语中近似于 q 的期望”。但是,我们将 q(x) 与 p(x) 的对数相乘(而不是 p(x)。将此构造称为期望值是否仍然正确?请告诉我。

在此处输入图像描述

1个回答

期望值是可以为结果的任何函数计算的量。

Ω是所有可能结果的空间,让q:\Omega \rightarrow \mathbb{R}是在\Omegaq:ΩR上定义的概率分布对于任何函数f:\Omega \rightarrow S其中S是在加法和标量乘法下闭合的任意集合(例如S = \mathbb{R} ),我们可以计算分布q下f的期望值如下: \mathbb {E}[f] = \mathbb{E}_{x \sim q}[f(x)] = \sum_{x \in \Omega} q(x) f(x) Ω f:ΩSSS=Rfq

E[f]=Exq[f(x)]=xΩq(x)f(x)

在 KL 散度中,对于一些固定的p(x),我们有f(x) = \ln{\frac{q(x)}{p(x)}}f(x)=lnq(x)p(x)p(x)