CNN 中的全连接层有什么作用?

机器算法验证 神经网络 深度学习 卷积神经网络
2022-02-05 22:11:52

我了解卷积层和池化层,但我看不出 CNN 中完全连接层的原因。为什么前一层不直接连接到输出层?

2个回答

卷积层的输出代表数据中的高级特征。虽然该输出可以被展平并连接到输出层,但添加全连接层是学习这些特征的非线性组合的(通常)便宜的方法。

本质上,卷积层提供了一个有意义的、低维的、有点不变的特征空间,而全连接层正在学习该空间中的(可能是非线性的)函数。

注意:从 FC 层转换为 Conv 层很简单。如本页所述,将这些顶部 FC 层转换为 Conv 层可能会有所帮助。

我发现 Anil-SharmaQuora上的这个回答很有帮助。

我们可以将整个网络(用于分类)分为两部分:

  • 特征提取:在传统的分类算法中,如支持向量机,我们习惯于从数据中提取特征以进行分类。卷积层用于特征提取的相同目的。CNN 可以更好地表示数据,因此我们不需要进行特征工程。

  • 分类:特征提取后,我们需要将数据分类为各种类别,这可以使用全连接 (FC) 神经网络来完成。代替全连接层,我们还可以使用传统的分类器,如 SVM。但我们通常最终会添加 FC 层以使模型端到端可训练。