我正在构建一个基于输入图像生成图像的生成对抗网络。从我读过的关于 GAN 的文献来看,生成器似乎接受了一个随机变量并使用它来生成图像。
如果我让生成器接收输入图像,它会不再是 GAN 吗?鉴别器会是无关的吗?
我正在构建一个基于输入图像生成图像的生成对抗网络。从我读过的关于 GAN 的文献来看,生成器似乎接受了一个随机变量并使用它来生成图像。
如果我让生成器接收输入图像,它会不再是 GAN 吗?鉴别器会是无关的吗?
如果您正在构建一个直接的“普通”生成对抗网络,最好将网络理解为一个统计引擎:您正在对统计分布样本训练生成器。(并且您正在训练鉴别器以区分“真实”图像和来自该生成器的图像。)
一旦你用另一个图像替换输入噪声......好吧。严格来说,它可能仍然是一个生成对抗网络,如果你仍然在做其他所有事情的话。它仍然是一个生成器和一个鉴别器,以对抗的方式起作用。
但是你已经从根本上改变了输入分布,所以你很有可能不再完成你想要完成的事情,除非你非常小心和聪明。
也就是说,有一些 GAN 变体确实将图像而不是噪声作为输入。请参阅 Zhu 等人关于 CycleGANs 的精彩论文,以及大量后续文献。请注意,CycleGAN 使用的不是一个,而是两个鉴别器,所以即使在这里鉴别器也是必要的。
简答
生成网络安排中的生成网络不直接学习输入图像。他们在训练期间的输入是来自判别网络的反馈。
理论总结
2014 年 6 月的开创性论文Generative Adversarial Networks , Goodfellow, Pouget-Abadie, Mirza, Xu, Warde-Farley, Ozair, Courville 和 Bengio 指出,“我们提出了一个通过对抗过程估计生成模型的新框架,在我们同时训练两个模型……”这两个模型在论文中被定义为 MLP(多层感知器)。
这两个模型是相互关联的,因此它们形成了一个负反馈循环。
应用概念
如果 G 接收输入图像,它们的存在只会阻碍网络训练,因为训练的目标可能没有充分定义。如上所述,G 收敛的目标不是学习如何处理图像以产生其他形式的输出。它在生成方法中的目标是学习如何生成一个与图像评估或图像处理完全不兼容的目标。
附加信息
此外,一张图像还远远不够。必须有足够大的示例图像集进行训练才能完全收敛,然后还要有更多示例图像才能期望收敛既准确又可靠。PAC(可能近似正确)学习分析框架可能有助于确定特定案例需要多少示例。
基本鉴别器
鉴别器对于生成方法是必不可少的,因为上面提到的反馈回路对于收敛机制是必不可少的。G 和 D 之间的双向相互依存关系允许采用平衡的方法来实现特征关系分布的准确性。这种准确性有助于人类感知生成的图像充分适合认知类别。
.
回应评论
尝试使用生成方法“在图像的间隙中绘画”是合理的。在这种情况下,使用 Goodfellow 的命名法,G 将生成丢失的像素,D 将尝试区分 G 的间隙填充和在引入之前在间隙区域中的场景中的像素。
在填充像素的场景中还有两个额外的要求。
建议从标准的 GAN 设计开始,为它创建一个测试(以 TDD 方式),实现它,进行实验,然后熟悉它和所涉及的数学。最重要的是要理解 G 的收敛和 D 的收敛之间的平衡是如何在每个函数的损失(也称为误差或视差)函数中获得的,以及使用这些函数采用了哪些反馈概念。
它适用于两者。
D比较,而不是G。那是委托安排。并不是说其他安排行不通。他们可能会。但是,Goodfellow 和其他人早在他们发现一种新方法之前就已经了解了人工网络中的工作原理,并且他们很可能在他们输入一行代码之前很久就已经计算出了这种方法的数学并绘制了图表,也许是在白板上。