卷积层与普通卷积网络有何不同?

数据挖掘 神经网络 卷积神经网络 特征提取 音频识别
2021-10-02 09:48:07

我目前正在重新创建本文的结果。在论文中,他们描述了一种使用 CNN 进行特征提取的方法,并拥有一个 Dnn-hmm 声学模型,并使用 RBM 进行了预训练。

第 III 小节 A 说明了可以表示输入数据的不同方式。我决定垂直堆叠静态、增量和增量增量的频谱图。

因此: 在此处输入图像描述

然后,该论文描述了网络应该如何。他们说他们使用卷积网络,但对网络的结构一无所知?此外,网络是否总是被称为卷积层?与普通网络卷积神经网络(cnn)相比,我确信我看到了任何差异。

该论文指出了这一点:

(来自第三节 B 小节)

然而,卷积层在两个重要方面不同于标准的全连接隐藏层。首先,每个卷积单元仅从输入的局部区域接收输入。这意味着每个单元代表输入的局部区域的一些特征。其次,卷积层的单元本身可以组织成多个特征图,其中同一特征图中的所有单元共享相同的权重,但从较低层的不同位置接收输入

我想知道的另一件事是,论文是否真的说明了需要多少输出参数来馈送 dnn-hmm 声学模型。我似乎无法解码过滤器的数量、过滤器的大小......在网络的一般细节中?

1个回答

看起来卷积层与普通卷积层完全相同。从他们的论文中,他们认为术语“CNN 层”通常是指一个卷积层,然后是一个池化层。为了减少混淆,他们将卷积部分命名为“卷积层”,将池化部分命名为“池层”:

在 CNN 术语中,图 2 中连续的一对卷积和池化层通常称为一个 CNN“层”。因此,深度 CNN 由两个或多个这些对连续组成。为避免混淆,我们将卷积层和池化层分别称为卷积层和池化层。

具有讽刺意味的是,这增加了混乱,导致了这篇文章。当时我认为在池化层之前连续有几个卷积层并不常见,但我们在现代架构中经常看到这种情况。

回答您关于网络结构的其他问题;他们陈述了他们在实验部分(第 VB 部分)中使用的网络结构。为了希望减少混淆,我将“ply”一词替换为“layer”:

在这些实验中,我们在顶部使用了一个卷积 [层]、一个池化 [层] 和两个完全连接的隐藏层。全连接层每个有 1000 个单元。卷积和池化参数为:池化大小为 6,移位大小为 2,滤波器大小为 8,FWS 为 150 个特征图,LWS 为每个频带 80 个特征图。