ELBO和SGVB有什么关系?

机器算法验证 机器学习 自动编码器 kullback-leibler 变分贝叶斯 差异
2022-04-04 11:28:55

证据下界(ELBO)可以最大化,从而找到目标分布的最合适的近似分布,相当于相应的Kullback-Leibler散度的最小化。介绍变分自动编码器 (VAE)的论文使用 SGVB(随机梯度变分贝叶斯)公式而不是 ELBO。这些有什么区别?

1个回答

证据下限是数据对数概率的界限。但是没有直接的方法来计算 ELBO,因为它需要对变分后验进行期望。因此,我们需要一个估计 ELBO 的程序(更具体地说,我们需要某种方法来估计 ELBO 的梯度,以便我们对其进行优化)。

直接的方法是简单地通过从变分后验采样来估计期望,然后使用得分函数梯度估计器计算估计器的梯度。然而,这种方法的方差对于实际使用来说太高了,这就是作者介绍他们的“SGVB”估计器的原因。