卷积神经网络的层表示法

数据挖掘 卷积神经网络 符号
2022-01-27 09:21:21

在阅读卷积神经网络 (CNN) 时,我经常遇到社区和科学论文中使用的一种特殊符号,它以层的形式描述网络的架构。但是,我找不到详细描述此符号的论文或资源。
有人可以向我解释细节或指出它在哪里被描述或“标准化”吗?

例子:

  1. input−100C3−MP2−200C2−MP2−300C2−MP2−400C2−MP2−500C2−output
    来源

  2. input−(300nC2−300nC2−MP2)_5−C2−C1−output
    来源


一个很好的猜测似乎是x Cy是卷积层(x是过滤器的数量?y是方形内核的一侧?)。MPz是最大池化层(池大小z × z?)。

但与其猜测,我更希望有一个参考(我也可以在论文中参考)。

1个回答

您链接到的第一篇论文引用的一篇论文在此处它在第 3 节(实验)中解释了以下符号:

2x48x48-100C5-MP2-100C5-MP2-100C4-MP2-300N-100N-6N 代表网络:

  • 2 个 48x48 大小的输入图像
  • 具有 100 个映射和 5x5 过滤器的卷积层
  • 在大小为 2x2 的非重叠区域上的最大池化层
  • 具有 100 个映射和 4x4 过滤器的卷积层
  • 在大小为 2x2 的非重叠区域上的最大池化层
  • 具有 300 个隐藏单元的全连接层,
  • 具有 100 个隐藏单元的全连接层
  • 具有 6 个神经元的全连接层(每类一个)

由此,您的问题的答案是:

  • 100C3 表示具有 100 个映射和 3x3 过滤器的卷积层
  • MP2 表示具有大小为 2x2 的非重叠区域的最大池化层
  • 200C2 表示具有 200 个映射和 2x2 过滤器的卷积层
  • 等带有“C”层(表示卷积,前面的整数是特征图的数量;最后的整数是滤波器大小)

根据您链接的第二篇论文,下标_5表示五对300nC2−300nC2−MP2连接层(参见第 3 节),n表示“第 n 个卷积层中的过滤器数量为 [300]n”。根据随附的模型图(链接论文中的图 3),C2C1层产生 1x1 输出,即标量值。这意味着C2是一个带有 1 个映射和一个 2x2 过滤器C1的卷积层,并且是一个带有 1 个映射和一个 1x1 过滤器的卷积层(尽管我不完全理解这增加了什么)。