我试图理解R1 正则化函数,包括抽象概念和公式中的每个符号。根据文章,R1的定义是:
它通过单独惩罚真实数据上的梯度来惩罚判别器偏离纳什均衡:当生成器分布产生真实数据分布并且判别器在数据流形上等于 0 时,梯度惩罚确保判别器无法创建一个与数据流形正交的非零梯度,而不会在 GAN 游戏中遭受损失。
我对 GAN 和反向传播的工作原理有基本的了解。我理解当判别者偏离纳什均衡时惩罚他的想法。其余部分变得模糊不清,即使它可能是基本的数学。例如,我不确定如果梯度与数据正交,为什么它很重要。
在方程式部分,它更加不清楚。鉴别器输入始终是图像,所以我假设是一个图像。那么什么是和?
(我知道这是一个基本问题,但对于我们这些简单的非研究人员、数学挑战者、无法理解原始文章的人来说,似乎没有关于它的博客)