存在从输入图像到输出图像的映射。假设输入图像是一张中间有一个方形孔的纸,输出图像是光线照射在纸上时输入图像的阴影,它看起来也像一个正方形,但有一些模糊和大小不同。(真实的图案远比这个方孔复杂)我正在尝试实现一个可以学习这种映射的神经网络,当给定输入图像时,网络可以预测输入图像的“阴影”。我尝试使用类似卷积自动编码器的结构(例如https://blog.keras.io/building-autoencoders-in-keras.html) 通过将目标图像从其自身的输入图像替换为输出图像训练集。但它看起来并不好用。我想知道什么样的神经网络适合这个任务?又适合什么样的损失函数呢?
什么样的神经网络结构适合图像到图像的学习?
数据挖掘
机器学习
深度学习
神经网络
图像分类
卷积神经网络
2022-02-20 03:17:08
1个回答
我想知道什么样的神经网络适合这个任务?
卷积自动编码器是一个很好的尝试,但对于这类问题,它存在一个小问题:潜在表示经常失去空间意识(特别是如果在编码器末端使用 FC 层)。对于这样的任务,一个像素在输入中可能与相应(相同位置)像素更相关(并且有用)在输出中,与其他一些较远的像素相比在输入。
出于这个原因,我建议使用U-net 架构,因为这样可以保留整个网络的空间局部性。
参考:
又适合什么样的损失函数呢?
一个好的起点是标准平均值或者输出图像的损失。由于您的图像不是自然图像,因此我不愿推荐感知损失,但它们也可以工作。
如果没有有关您的架构和数据的更多详细信息,恐怕我不能说更多。
其它你可能感兴趣的问题