我想知道为什么滑动窗口的卷积实现等价于顺序逐步滑动窗口?为什么它们是一样的?
我正在关注 Andrew NG: 据我所知,图片中的第一行应该是一个经过 4 个类训练的卷积网络。
第二行应该是 3 通道 16x16 图像,由第一行(即16 5x5 filters -> 2x2 Max Pool -> 400 5x5 filters -> 400 1x1 filter -> 4 1x1 filter)经过训练的卷积网络进行卷积,据我了解,棘手的部分是输出相当于将 14x14 窗口滑动到 16x16 图像上只有 4 个位置,它们是 2x2x4 输出,2x2 网格中的每个单元格对应 16x16 图像上 14x14 窗口的一个位置。
最后一行是另一个示例,但具有更大的 28x28 图像和相同的窗口大小 14x14。
