SqueezeNet 架构尺寸表中的深度是什么意思?

数据挖掘 深度学习 美国有线电视新闻网
2021-09-27 21:59:09

第一次阅读 SqueezeNet 论文。根据我的理解,一个火灾模块包含一个 1x1 过滤器的挤压层和一个 1x1 和 3x3 过滤器的扩展层。如果我们以 fire2 为例,输入尺寸为 55x55x96,我们使用 16 个 1x1 过滤器对其进行卷积。这将返回 55 x55x16 输出。然后我们获取输出并应用两个卷积,一个使用 64 个 1x1 过滤器,另一个使用 64 个 3x3 过滤器。然后我们连接这两个结果以创建 55x55x128 的最终输出。在这种情况下,深度 2 是什么意思?另外,如何计算每一层的参数数量?

SqueezeNet 架构尺寸表

1个回答

在本文中,深度定义为层数。该表显示了depth=2火层的 a,因为每个火层都由 2 层组成。首先是挤压层,然后是扩展层。

要计算 CNN 的参数数量,我们可以对单层执行以下操作。假设输入为 28*28*64。这是具有 64 个通道的 MNIST 数据集的大小。现在假设我们想将此输入与 3*3 内核的 32 个过滤器进行卷积。

让我们给出以下变量名称,l=64是输入中的通道数,m=n=3是内核的大小和k=32是过滤器的数量。然后将参数的数量计算为

((nml)+1)k=((3364)+1)32=18,464.

+1用于添加偏差。


为了计算 fire2 中的参数数量,我们首先注意到该模块由 2 个不同的层组成。

第 1 层 - 挤压层 -s1x1

l=96,m=n=1k=16. 因此,总共有 1,552 个。

第 2 层 - 扩展层

内核大小 1 -e1x1

l=16,m=n=1k=64. 因此,总共有 1,088 个。

内核大小 3 -e3x3

l=16,m=n=3k=64. 因此,总共给出了 9,280。

全部的

因此,共有1,552+1,088+9,280=11,920.