具有级联数据的 ConvNet

数据挖掘 机器学习 深度学习 神经网络 卷积神经网络
2022-02-15 00:04:46

我有一个关于卷积神经网络的基本问题。假设我有一组 1000 个 RGB 图像,我从这组图像中训练一个 CNN。我显然可以将每个 RGB 图像分成 3 个不同的灰度图像,每个代表红色、绿色和蓝色阵列 - 从而创建 3000 个灰度图像。

我的问题是:如果我从这 3000 张灰度图像中训练一个 CNN,我会从第一个 CNN 获得相同的参数吗?更准确地说,当我们输入 RGB 图像时,CNN 的行为如何?它是从 RGB 图像中提取组合特征,还是仅仅分别学习每个 R、G、B 通道中的特征?

2个回答

它在通道维度上表现得像一个完全连接的网络。对于每个像素位置,CNN 采用通道维度上该位置的所有像素的加权和。权重当然是可训练的。

不过,这仅适用于第一层,因为之后的层有任意数量的通道,这些通道与原始图像中的颜色无关。

您还可以阅读这个答案,我在其中更详细地解释了操作的工作原理。

感谢您的回答。所以在这种情况下,如果我输入 1000 个 RGB 图像和 3000 个从这 1000 个 RGB 图像中分离出来的灰度图像,我会得到不同的网络参数,对吗?还有最可能不同的网络维度,对吧?

我问这个问题是因为我正在处理稍微复杂一点的数据结构,而不是 RGB 图像,我将处理由 12 个通道组成的多光谱图像。RGB 图像通常只有 3 个通道(如果 Alpha 被激活并且 JPEG 显然无法处理 Alpha 通道,则为 4 个)。