颜色信息是否仅在卷积神经网络的第一个输入层中提取?

人工智能 神经网络 深度学习 卷积神经网络 图像识别
2021-11-15 21:00:43

在卷积神经网络 (CNN) 中,由于 RGB 值在第一个卷积层中相乘,这是否意味着本质上只在第一层提取颜色?

CS231n Convolutional Neural Networks for Visual Recognition的片段

通过这种可视化可以很容易地注意到一个危险的陷阱是,对于许多不同的输入,一些激活图可能全为零,这可能表明过滤器失效,并且可能是高学习率的症状。

另一个。

训练有素的 AlexNet 的第一个 CONV 层(左)和第 5 个 CONV 层(右)的典型激活,查看一张猫的照片。每个框显示对应于某个过滤器的激活图。请注意,激活是稀疏的(大多数值为零,在此可视化中以黑色显示)并且大部分是局部的。

1个回答

神经网络都是关于获取原始输入数据(RGB 值和像素位置)并学习与某些下游任务相关的有用特征。这种将原始输入聚合成更高级别特征的过程可以从输入之后的第一层开始。

所以是的,只有网络的第一层使用来自图像的实际原始颜色信息。除此之外,网络已经开始将附近的像素和不同的颜色通道放在一起,以便找到更复杂的模式。神经网络中的较深层通常对较早层中学习的特征进行进一步聚合,而不是将原始颜色信息作为输入。