如何为神经网络准备彩色图像?

数据挖掘 神经网络 深度学习 图像分类
2021-10-13 02:45:00

我在网上看到了很多关于 MNIST 数据集的例子,但都是黑白的。在这种情况下,可以构造一个二维数组,其中每个数组元素的值代表相应像素的强度。但是,如果我想做彩色图像怎么办?表示 RGB 数据的最佳方式是什么?

这里有一个非常简短的讨论,我在下面引用。但是,我仍然不明白应该如何组织 RGB 数据。此外,我们应该使用一些 OpenCV 库/命令来预处理彩色图像吗?

第二个卷积池层中的特征检测器可以访问前一层的所有特征,但只能在其特定的局部感受野内*

*如果输入图像是彩色的,这个问题会出现在第一层。在这种情况下,每个像素都有 3 个输入特征,对应于输入图像中的红色、绿色和蓝色通道。因此,我们将允许特征检测器访问所有颜色信息,但只能在给定的本地感受野内。

1个回答

您的 R、G 和 B 像素值可以分成 3 个单独的通道(在大多数情况下,这是为您完成的)。这些通道的处理方式与网络更高级别的特征图没有区别。卷积自然扩展到超过 2 个维度。

想象一下灰度单通道示例。假设您在第一层有 N 个要学习的特征图。然后这一层的输出(以及第二层的输入)将由 N 个通道组成,每个通道都是将特征图与图像中的每个窗口卷积的结果。第一层有 3 个通道也不例外。

本教程在卷积方面做得很好。

http://deeplearning.net/tutorial/lenet.html