在Krizhevsky 等人于 2012 年发表的关于 ImageNet 分类与深度卷积网络的开创性论文中,作者在第 3.4 节讨论了卷积神经网络中的重叠池化。
CNN 中的池化层汇总了同一核图中相邻神经元组的输出。传统上,由相邻池单元汇总的邻域不重叠(例如,[17,11,4])。更准确地说,池化层可以被认为是由间隔 s 个像素的池化单元网格组成,每个池化单元汇总一个大小为 z × z 的邻域,以池化单元的位置为中心。如果我们设置 s = z,我们将获得 CNN 中常用的传统局部池化。如果我们设置 s < z,我们会得到重叠池化。这是我们在整个网络中使用的,s = 2 和 z = 3。与非重叠方案 s = 相比,该方案将 top-1 和 top-5 错误率分别降低了 0.4% 和 0.3% 2,z = 2,产生等效尺寸的输出。我们通常在训练期间观察到,具有重叠池的模型发现过拟合稍微困难一些。
重叠池有助于减少卷积网络中的过度拟合的直觉是什么?