了解 CNN 中的层

数据挖掘 神经网络 美国有线电视新闻网
2022-03-12 04:39:01

我是 NN 的新手,我对 CNN 中的卷积层有疑问。据说卷积层执行特征提取或在 CNN 中用作特征提取器。第一个卷积层学习提取低级特征,这意味着第一层将原始图像转换为原始图像的多个副本(取决于使用的过滤器的数量),这些副本仅包含低级特征,而忽略任何其他原始图像中的特征,对吗?

如果它们已经被第一层忽略,那么下一层如何提取其他特征高级特征,即面部?

为什么我们没有几个单独的层,每个层都对某些特征进行特定的提取,一旦提取了所有需要的特征,输出就会在全连接层之前合并?

我不明白在已经过滤的条目上应用不同的过滤器(在第一层之后)。

1个回答

这是一个很好的问题,因为它涉及重要的神经网络概念。

“为什么我们没有几个单独的层,每个层都对某些特征进行特定的提取,并且一旦提取了所有需要的特征”

答案是双重的。

首先,这些层相互依赖。更深层可以提取更高级别特征的原因是它们建立在早期层中提取的较低特征的基础上。这些层在架构上可能不同,但它们可能只是相同的层,重复多次并使用相同的权重进行初始化。

其次,重要的是要了解这些层没有“告诉”要提取什么类型的特征。意识到每一层代表不同级别的特征对于更好地理解神经网络的行为并确认不,这并不全是黑魔法非常重要。重要的是要了解这是一种学习人工制品,根据所涉及的网络、数据和培训策略,它可能并不总是发生。