什么是分数步长卷积层?

数据挖掘 深度学习 计算机视觉 卷积 卷积神经网络
2021-09-17 11:03:10

在论文Generating High-Quality Crowd Density Maps using Contextual Pyramid CNNs 3.4 节中,它说

由于这项工作的目的是估计高分辨率和高质量的密度图,因此 F-CNN 是使用一组卷积和部分步幅卷积层构建的。部分步幅卷积层集帮助我们恢复输出密度图中的细节。以下结构用于 F-CNN:CR(64,9)-CR(32,7)-TR(32)-CR(16,5)-TR(16)-C(1,1),其中, C 是卷积层,R 是 ReLU 层,T 是分数步长卷积层,每个大括号内的第一个数字表示过滤器的数量,而第二个数字表示过滤器的大小。每个小步长卷积层将输入分辨率提高 2 倍,从而确保输出分辨率与输入分辨率相同。

我想知道分数步幅卷积层的细节。

1个回答

这是一个分数步幅卷积的动画(来自这个github 项目):

其中白色虚线单元格是在输入单元格(蓝色)之间填充的行/列。这些动画是以下文章中数学公式的可视化:

深度学习卷积算法指南

这是文章的引述:

图 [..] 有助于理解分数步幅所涉及的内容:在输入单元之间插入零,这使得内核以单位步幅更慢的速度移动[脚注:这样做效率低下,现实世界的实现避免了无用的零乘法,但从概念上讲,这是如何考虑跨步卷积的转置。]


另外,这里有一个帖子在这个网站上询问“什么是反卷积层?” 这是同一件事。

以下是 Paul-Louis Prove关于不同类型卷积的帖子中的两处引述:

转置卷积(又名反卷积或小步幅卷积)

一些来源使用名称反卷积,这是不恰当的,因为它不是反卷积 [..] 实际的反卷积会恢复卷积的过程。