我知道 KL 散度衡量两个概率分布之间的差异。我的疑问是它可以成为无限的分布,换句话说,P(x)它必须产生Q(x)不能产生的值。
或者Q(x)必须在0哪里P(x)没有,因为KL散度如下:
谁能告诉我,通过选择 P(x) 和 Q(x) 的哪些概率分布,我们可以实现 KL 散度为无穷大。
我认为选择 P(x) 作为均匀分布,选择 Q(x) 作为高斯分布可以得到无穷大,对吗?
我知道 KL 散度衡量两个概率分布之间的差异。我的疑问是它可以成为无限的分布,换句话说,P(x)它必须产生Q(x)不能产生的值。
或者Q(x)必须在0哪里P(x)没有,因为KL散度如下:
谁能告诉我,通过选择 P(x) 和 Q(x) 的哪些概率分布,我们可以实现 KL 散度为无穷大。
我认为选择 P(x) 作为均匀分布,选择 Q(x) 作为高斯分布可以得到无穷大,对吗?
当和/或为零时,从严格意义上讲,零的对数是未定义的,因为没有的值使得。但是,KL 散度的定义使用以下约定(参见 Cover 和 Thomas,信息理论的要素):
这意味着如果存在q的 x ,则 KL 散度是无限的。相反,为零不会产生无穷大,无论是否也为零。另一种说法是,只有当的支持包含在的支持中时,KL 散度才是有限的。但是,请注意,即使和对于所有都不为零,KL 散度也可能是无限的(参见此处的示例)。
关于您的示例,这意味着如果是高斯且是均匀的,则 KL 散度将是无限的,但反之则不然。