我遇到了这个问题,我试图使用编码器-解码器 CNN 将输入图像中的像素分类,类似于分割。“感兴趣”的像素通常位于输入图像的右上角,但是输入图像太大,我必须将它们分割成块,这样做,每个输入块都会丢失其“整个图片的哪个区域”它来自”信息。
我正在使用 pytorch,我想手动将此补丁位置信息添加到输入中,但随后它会很复杂,这对我来说确实有意义,因为它不是图像的一部分。
我是新手,不确定我是否认为整个事情正确,我应该如何手动将此信息正确地添加到输入中,或者如果有一些关键字我可以做一些研究,以便让 CNN 占据位置考虑到?谢谢你。