机器算法验证 - 为什么生成对抗网络中的最优判别器？D*G( x ) =p数据( × )p数据( x ) +pG( × )DG∗(x)=pdata(x)pdata(x)+pg(x) - 吾爱随笔录

为什么生成对抗网络中的最优判别器？D*G( x ) =p数据( × )p数据( x ) +pG( × )DG∗(x)=pdata(x)pdata(x)+pg(x)

机器算法验证机器学习神经网络深度学习甘

2022-03-09 17:06:15

命题1，
最优判别器为证明时，我无法理解积分变量的变化。

D_{G}^{*} (x) = \frac{p_{data} (x)}{p_{data} (x) + p_{g} (x)}

$D^{*}_G(x) = \frac{p_\text{data}(x)}{p_\text{data}(x) + p_g(x)}$

为什么第一行改为第二行？！

V (G, D) = \int_{x} p_{data} (x) \log (D (x)) d x + \int_{z} p_{Z} (z) \log (1 - D (g (z))) d z = \int_{x} p_{data} (x) \log (D (x)) + p_{g} (x) \log (1 - D (x)) d x

$V(G,D) = \int_x p_\text{data}(x)\log(D(x))\,dx + \int_z p_Z(z)\log(1-D(g(z)))\,dz \\ = \int_x p_\text{data}(x)\log(D(x)) + p_g(x)\log(1-D(x))\,dx$

我试着自己计算了一下。

但是需要以下条件才能将 V(G,D) 的第一行更改为第二行 $V(G,D)$ $V(G,D)$

p_{z} (z) \frac{1}{g^{'} (z)} = p_{g} (x)

$p_z(z) \frac{1}{g'(z)}=p_g(x)$

总之..我的问题是..

为什么V(G,D)的第一行可以改成V(G,D)的第二行
在我自己尝试更改 V(G,D) 时，需要上述条件。条件合适吗？！

4个回答

Hi~ 要了解变量的变化，我们可以先看一下Generative Adversarial Networks , Goodfellow et al (2014), eprint arXiv:1406.2661 中的图 1。

根据论文。

下面的水平线是从中的域，上面的水平线是的域的一部分。向上的箭头表示变换。 $z$ $x$ $x = g(z)$

回到等式，很明显：

\int_{z} p_{Z} (z) \log (1 - D (g (z)) d z = E_{p_{z}} [\log (1 - D (g (z))]

$\int_z p_Z(z)\log(1-D(g(z))\,dz=E_{p_z}[\log(1-D(g(z))]$

由于，我们可以用变量。另请注意，在这种情况下，是的分布。结果，我们有这个： $x = g(z)$ $g(z)$ $x$ $p_g$ $x$

E_{p_{Z}} [\log (1 - D (g (z))] = E_{p_{g}} [\log (1 - D (x))]

$E_{p_Z}[\log(1-D(g(z))] = E_{p_g}[\log(1-D(x))]$

然后我们将期望扩展为一个积分形式：

E_{p_{g}} [\log (1 - D (x))] = \int_{x} p_{g} (x) \log (1 - D (x)) d x

$E_{p_g}[\log(1-D(x))] = \int_x p_g(x)\log(1-D(x))\,dx$

Q1：为什么 V(G,D) 的第一行改为的第二行？ $V(G,D)$ $V(G,D)$

的最大值，因此第一行的更好表示法可能是 $V(G,D)$

max [V (G, D)] = max [\int_{x} p_{data} (x) \log (D (x)) d x + \int_{z} p_{Z} (z) \log (1 - D (g (z))) d z]

$\max[V(G,D)] = \max\left[\int_x p_\text{data}(x)\log(D(x))\,dx + \int_z p_Z(z) \log(1-D(g(z)))\,dz\right]$

然后是第二行

max [V (G, D)] = max [\int_{x} p_{data} (x) \log (D (x)) + p_{g} (x) \log (1 - D (g (z))) d x]

$\max[V(G,D)]= \max \left[ \int_x p_\text{data}(x)\log (D(x)) + p_g(x) \log(1-D(g(z))) \, dx\right]$

在积分内部有的形式，它在中达到最大值。这意味着允许积分的最大和，这允许第一行通向第二行。 $y → a \log(y) + b \log(1 − y)$ $[0, 1]$ $\frac a {a+b }$ $z=x$

Q2：这样合适吗？

如果在。我认为问题表明除非。答案的形式为，其中和。 $g'(z)=1$ $\max[p_g(x)]$ $\max[V(G,D)] \neq V(G,D)$ $D^{*}_G(x) = \frac{p_\text{data}(x)}{p_\text{data}(x) + p_g(x)}$ $\frac a {a+b }$ $p_\text{data}(x)=a$ $P_g(x)=b$

你基本上已经明白了。因此的定义（参见第 4 节理论结果的第一段）是当来自分布的分布。因此 $p_g$ $G(z)$ $z$ $p_z$

\int_{z} p_{Z} (z) \log (1 - D (g (z)) d z = E_{p_{Z}} [\log (1 - D (g (z))] = E_{p_{x}} [\log (1 - D (x))]

$\int_z p_Z(z)\log(1-D(g(z))dz=E_{p_Z}[\log(1-D(g(z))]=E_{p_x}[\log(1-D(x))]$

由于是从到的确定性映射，因此令，则 . 所以 $z \mapsto G(z)$ $\mathcal{Z}$ $\mathcal{X}$ $y = G(z)$ $p(y|z) = \delta(y - G(z))$

\begin{aligned} \int_{X} p_{g} (y) \log (1 - D (y)) d y & = \int_{X} [\int_{Z} p (z, y) d z] \log (1 - D (y)) d y \\ = \int_{X} [\int_{Z} p (z) p (y | z) d z] \log (1 - D (y)) d y \\ = \int_{X} [\int_{Z} p (z) d z] p (y | z) \log (1 - D (y)) d y \\ = \int_{Z} p (z) [\int_{X} δ (y - G (z)) \log (1 - D (y)) d y] d z \\ = \int_{Z} p (z) [δ (y - G (z)) * \log (1 - D (y))] d z \\ = \int_{Z} p (z) \log (1 - D (G (z))) d z . \end{aligned}

$\begin{split} \int_{\mathcal{X}} p_g(y)\log(1 - D(y)) dy & = \int_{\mathcal{X}} \left[\int_{\mathcal{Z}}p(z,y)dz\right]\log(1-D(y))dy \\ & = \int_{\mathcal{X}} \left[\int_{\mathcal{Z}}p(z)p(y|z)dz\right]\log(1-D(y))dy \\ & = \int_{\mathcal{X}} \left[\int_{\mathcal{Z}}p(z)dz\right]p(y|z)\log(1-D(y))dy \\ & = \int_{\mathcal{Z}}p(z)\left[\int_{\mathcal{X}}\delta(y - G(z))\log(1 - D(y))dy\right]dz \\ & = \int_{\mathcal{Z}}p(z)\left[\delta(y-G(z)) * \log(1-D(y))\right]dz \\ & = \int_{\mathcal{Z}}p(z)\log(1 - D(G(z)))dz. \end{split}$

倒数第二行到最后一行是狄拉克δ函数的卷积性质。

其它你可能感兴趣的问题

上一篇添加特征如何降低模型的性能？下一篇在 GAN 等生成模型的背景下，对数似然意味着什么？