使用全连接网络 (FCN) 时,即使在阅读http://cs231n.github.io/convolutional-networks/#convert之后,我仍然无法理解全连接 (FC) 层到卷积层转换的实际工作原理。
在这个例子中,据我了解,转换后的 CONV 层应该有形状(7,7,512),意思是(宽度,高度,特征尺寸)。我们有 4096 个过滤器。每个滤波器的空间大小的输出可以计算为 (7-7+0)/1 + 1 = 1。因此我们有一个 1x1x4096 的向量作为输出。
尽管转换后的层可以为我们提供相同大小的输出,但我们如何确保它们在功能上确实是等效的?在文章的后面部分提到,我们需要将 FC 层的权重矩阵重塑为 CONV 层过滤器。但我仍然对如何实际实现它感到困惑。
欢迎任何解释或链接到其他学习资源。