什么样的神经网络结构适合图像到图像的学习?

数据挖掘 机器学习 深度学习 神经网络 图像分类 卷积神经网络
2022-02-20 03:17:08

存在从输入图像到输出图像的映射。假设输入图像是一张中间有一个方形孔的纸,输出图像是光线照射在纸上时输入图像的阴影,它看起来也像一个正方形,但有一些模糊和大小不同。(真实的图案远比这个方孔复杂)我正在尝试实现一个可以学习这种映射的神经网络,当给定输入图像时,网络可以预测输入图像的“阴影”。我尝试使用类似卷积自动编码器的结构(例如https://blog.keras.io/building-autoencoders-in-keras.html) 通过将目标图像从其自身的输入图像替换为输出图像训练集。但它看起来并不好用。我想知道什么样的神经网络适合这个任务?又适合什么样的损失函数呢?

1个回答

我想知道什么样的神经网络适合这个任务?

卷积自动编码器是一个很好的尝试,但对于这类问题,它存在一个小问题:潜在表示经常失去空间意识(特别是如果在编码器末端使用 FC 层)。对于这样的任务,一个像素pij在输入中可能与相应(相同位置)像素更相关(并且有用)p^ij在输出中,与其他一些较远的像素相比pk在输入。

出于这个原因,我建议使用U-net 架构,因为这样可以保留整个网络的空间局部性。

参考:

又适合什么样的损失函数呢?

一个好的起点是标准平均值L1或者L2输出图像的损失。由于您的图像不是自然图像,因此我不愿推荐感知损失,但它们也可以工作。

如果没有有关您的架构和数据的更多详细信息,恐怕我不能说更多。