颜色信息是否仅在卷积神经网络的第一个输入层中提取?

数据挖掘 机器学习 神经网络 深度学习 美国有线电视新闻网 图像识别
2022-02-14 03:41:26

在卷积神经网络 (CNN) 中,由于 RGB 值在第一个卷积层中相乘,这是否意味着本质上只在第一层提取颜色?

来自斯坦福 CS231n CNN 章节的片段:

[...] 这种可视化很容易发现一个危险的陷阱,即对于许多不同的输入,一些激活图可能全为零,这可能表明过滤器失效,并且可能是高学习率 [...]训练有素的 AlexNet 的第一个 CONV 层(左)和第 5 个 CONV 层(右)的典型激活,查看一张猫的照片。每个框显示对应于某个过滤器的激活图。请注意,激活是稀疏的(大多数值为零,在此可视化中以黑色显示)并且大部分是局部的。

1个回答

你带来的报价是在谈论其他事情。零意味着你的大部分神经元的线性部分都有一个负值,并且在通过ReLU非线性,它们变为零。这就是那部分的解释。关于你的问题,不是真的。我不知道您是否曾经对卷积网络进行过可视化,但您已经完成了,您可能已经看到,即使在深层,也可能有一些层被激活用于特殊颜色。原因是卷积层只是尝试对具有三个通道的输入进行互相关操作。考虑到例如输入有 64 个通道,下一层卷积也会这样做。总而言之,可能还有其他使用颜色信息的深层,虽然这些操作真的不关心颜色,但它们关心输入中可能发生的局部模式。学习颜色的原因是相似的颜色在它们的 RGB 通道中具有相似的图案。这些模式是卷积网络试图学习的。看看已经讨论过的工具箱在这里