机器算法验证 - 当使用变分自动编码器生成样本时，我们从ñ( 0 , 1 )N(0,1)代替μ + σñ( 0 , 1 )μ+σN(0,1) - 吾爱随笔录

背景：我试图了解变分自动编码器作为生成器的使用。我的理解：

在训练期间，对于一个输入点 $x_i$ 我们想学习潜在的 $\mu_i$ 和 $\sigma_i$ 然后采样 $z_i \sim N(\mu_i, \sigma_i)$ 并将其馈送到解码器以进行重建 $\hat{x}_i = \text{decode}(z_i)$ .
但是我们不能用采样算子做反向传播，所以我们重新参数化并使用 $z_i = \mu_i + \sigma_i \epsilon$ 在哪里 $\epsilon \sim N(0, 1)$ . 我们的重建变成 $\hat{x}_i = \text{decode}(\mu_i + \sigma_i \epsilon)$ .

但是，当我们完成训练并准备将其用作生成器时，我们会采样 $z \sim N(0, 1)$ 并将其提供给解码器： $x_{sample} = \text{decode}(z)$ .

让我困惑的部分是，在训练期间，解码操作是使用 $\mu_i + \sigma_i \epsilon$ 据我了解，这是使用 $N(\mu_i, \sigma_i)$ 与不同 $\mu_i$ 和 $\sigma_i$ 对于每个训练示例。然而，在生成期间，解码操作（有效地）在 $\epsilon$ 独自从 $N(0, 1)$ . 我们为什么要设置 $\mu = 0$ 和 $\sigma = 1$ 在生成期间（即使用 $z = 0 + 1 \cdot \epsilon$ )?