在 Christian Ledig 等人的论文Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network中,图像之间的距离(用于损失函数)是根据从VGG19 中提取的计算的网络,
其中定义为“在第 i 个最大池化层之前通过第 j 个卷积(激活后)获得的特征图”。
您能否详细说明如何计算此特征图,可能是针对论文中提到的 VGG54?
表示第 5 个最大池化层之前的第 4 个卷积层,对吗?但是第 4 层有 512 个过滤器。所以我们将有 512 个特征空间。从这个中选择哪一个?另外“激活后”是什么意思?
我发现这个答案与同一问题有关,但答案并没有解释太多。