一个完全卷积的网络能否总是返回与原始大小相同的图像?

人工智能 机器学习 深度学习 卷积神经网络 计算机视觉 全卷积网络
2021-10-28 11:07:54

我正在尝试使用完全卷积神经网络对多种尺寸的图像执行分割任务。

目前,我使用 EfficientNet 作为特征提取器,并添加反卷积/反向卷积/转置卷积层,如原始全卷积网络用于语义分割论文中所述。

但是对于不同大小的图像,这个转置卷积层不会返回大小与原始图像相同的过滤器。

例如,假设原始图像是100×100,最后一层包含大小为50×50. 要获得与原始大小相同的过滤器,您需要一个大小为的转置卷积层51×51.

现在,假设您传入了一个大小为200×200. 最后一层将包含大小的过滤器100×100. 相同大小的转置卷积滤波器51×51将导致大小的输出150×150.

有什么方法可以使完全卷积网络始终返回与原始图像大小相同的图像?

1个回答

我最终使用了解决方法。

我设置了网络,这样一个 C x C(即 320 x 320)输入将为某个常数 C(在我的例子中是 320)输出一个 C x C 掩码。

然后我将要传递的图像大小调整为 C x C,然后将输出大小调整回图像的原始大小。