人工智能 - 试图理解 VGG 卷积神经网络架构 - 吾爱随笔录

试图了解 VGG 架构，我有以下问题。

我理解增加过滤器大小的一般理解是因为我们正在使用最大池化，因此它的图像大小会减小。所以为了保持信息增益，我们增加了过滤器的大小。但是在 VGG 架构的最后几层，当 vgg 从 14x14 最大池化到 7x7 图像大小时，滤波器大小保持不变，滤波器大小保持在 512x512 不变。为什么不需要增加过滤器尺寸呢？
最后，还有几个连续的层是用相同的过滤器和图像大小构建的，这些层是为了提高精度而构建的？（实验？）
而且我无法在最终过滤器中环绕该可视化，将整个面部作为我通过卷积可视化理解的特征（Matt Zieler 视频解释）。但是最大池化导致我们只能看到图像的子集部分，对吗？当过滤器大小为 512x512（面部作为过滤器/特征）时，图像大小为 7x7，那么当我们在图像像素的小子集上移动时，整个面部作为过滤器将如何作用于图像？