许多进行语义分割的架构,如 SegNet、DilatedNet(Yu 和 Koltun)、DeepLab 等,都不适用于高分辨率图像。对于像Cityscapes这样的基准,这些方法在基准上执行的标准/实用方法是什么?
我试图查看论文,但我找不到这样的细节。有一篇文章提到他们输出输入图像的 1/8,而不是从结果中进行插值(通常是 2、4 或 8 倍),但文章没有具体说明哪种上采样技术是最合理的。
许多进行语义分割的架构,如 SegNet、DilatedNet(Yu 和 Koltun)、DeepLab 等,都不适用于高分辨率图像。对于像Cityscapes这样的基准,这些方法在基准上执行的标准/实用方法是什么?
我试图查看论文,但我找不到这样的细节。有一篇文章提到他们输出输入图像的 1/8,而不是从结果中进行插值(通常是 2、4 或 8 倍),但文章没有具体说明哪种上采样技术是最合理的。
您始终可以使用更高分辨率的图像训练您的网络。如果您对推理时间没有任何限制,则没有什么可以阻止您这样做。
此外,该论文实际上提到了如何上采样。检查短语“使用反卷积层上采样”。
最常见的上采样方法是使用反卷积层或仅通过简单的调整大小方法(如图像调整大小)。