试图了解 VGG 架构,我有以下问题。
- 我理解增加过滤器大小的一般理解是因为我们正在使用最大池化,因此它的图像大小会减小。所以为了保持信息增益,我们增加了过滤器的大小。但是在 VGG 架构的最后几层,当 vgg 从 14x14 最大池化到 7x7 图像大小时,滤波器大小保持不变,滤波器大小保持在 512x512 不变。为什么不需要增加过滤器尺寸呢?
- 最后,还有几个连续的层是用相同的过滤器和图像大小构建的,这些层是为了提高精度而构建的?(实验?)
- 而且我无法在最终过滤器中环绕该可视化,将整个面部作为我通过卷积可视化理解的特征(Matt Zieler 视频解释)。但是最大池化导致我们只能看到图像的子集部分,对吗?当过滤器大小为 512x512(面部作为过滤器/特征)时,图像大小为 7x7,那么当我们在图像像素的小子集上移动时,整个面部作为过滤器将如何作用于图像?