在论文Generating High-Quality Crowd Density Maps using Contextual Pyramid CNNs 3.4 节中,它说
由于这项工作的目的是估计高分辨率和高质量的密度图,因此 F-CNN 是使用一组卷积和部分步幅卷积层构建的。部分步幅卷积层集帮助我们恢复输出密度图中的细节。以下结构用于 F-CNN:CR(64,9)-CR(32,7)-TR(32)-CR(16,5)-TR(16)-C(1,1),其中, C 是卷积层,R 是 ReLU 层,T 是分数步长卷积层,每个大括号内的第一个数字表示过滤器的数量,而第二个数字表示过滤器的大小。每个小步长卷积层将输入分辨率提高 2 倍,从而确保输出分辨率与输入分辨率相同。
我想知道分数步幅卷积层的细节。
