当我阅读这篇论文时,全卷积网络用于语义分割,我发现他们使用上采样层将每个像素分类到一个类中。我有两个问题:
您如何理解反卷积操作背后的数学原理?
为什么我们使用上采样层?是为了提取更多的全球背景吗?
当我阅读这篇论文时,全卷积网络用于语义分割,我发现他们使用上采样层将每个像素分类到一个类中。我有两个问题:
您如何理解反卷积操作背后的数学原理?
为什么我们使用上采样层?是为了提取更多的全球背景吗?
上采样层用于提高图像的分辨率。在分割中,我们首先对图像进行下采样以获得特征,然后对图像进行上采样以生成片段。
对于反卷积操作,我们用零填充图像,然后对其进行卷积操作,因此对其进行了上采样。
例如: - 如果在对图像进行下采样后变为:
[[1, 1]
[1, 1]]
然后如果我们用零填充它,
[[0, 0, 0, 0, 0, 0]
[0, 0, 0, 0, 0, 0]
[0, 0, 1, 1, 0, 0]
[0, 0, 1, 1, 0, 0]
[0, 0, 0, 0, 0, 0]
[0, 0, 0, 0, 0, 0]]
现在,如果我们使用 3 x 3 滤波器对上述图像进行卷积,我们将得到形状为 (4, 4) 的图像。因此,我们将形状为 (2, 2) 的图像上采样为 (4, 4)。