数据挖掘 - 什么样的神经网络结构适合图像到图像的学习？ - 吾爱随笔录

什么样的神经网络结构适合图像到图像的学习？

数据挖掘机器学习深度学习神经网络图像分类卷积神经网络

2022-02-20 03:17:08

存在从输入图像到输出图像的映射。假设输入图像是一张中间有一个方形孔的纸，输出图像是光线照射在纸上时输入图像的阴影，它看起来也像一个正方形，但有一些模糊和大小不同。（真实的图案远比这个方孔复杂）我正在尝试实现一个可以学习这种映射的神经网络，当给定输入图像时，网络可以预测输入图像的“阴影”。我尝试使用类似卷积自动编码器的结构（例如https://blog.keras.io/building-autoencoders-in-keras.html) 通过将目标图像从其自身的输入图像替换为输出图像训练集。但它看起来并不好用。我想知道什么样的神经网络适合这个任务？又适合什么样的损失函数呢？

1个回答

我想知道什么样的神经网络适合这个任务？

卷积自动编码器是一个很好的尝试，但对于这类问题，它存在一个小问题：潜在表示经常失去空间意识（特别是如果在编码器末端使用 FC 层）。对于这样的任务，一个像素 $p_{ij}$ 在输入中可能与相应（相同位置）像素更相关（并且有用） $\widehat{p}_{ij}$ 在输出中，与其他一些较远的像素相比 $p_{\ell k}$ 在输入。

出于这个原因，我建议使用U-net 架构，因为这样可以保留整个网络的空间局部性。

参考：

又适合什么样的损失函数呢？

一个好的起点是标准平均值 $L_1$ 或者 $L_2$ 输出图像的损失。由于您的图像不是自然图像，因此我不愿推荐感知损失，但它们也可以工作。

如果没有有关您的架构和数据的更多详细信息，恐怕我不能说更多。

其它你可能感兴趣的问题

上一篇了解逻辑回归损失函数方程下一篇产品缺货预测