为什么这不是普通的卷积?

数据挖掘 神经网络 卷积神经网络 卷积
2021-10-02 23:46:32

我目前正在研究这篇论文(第 53 页),其中建议以特殊方式进行卷积。

这是公式:

(1)qj,m=σ(in=1Foi,n+m1wi,j,n+w0,j)

这是他们的解释:

如图4.2所示,所有输入的feature map(共假设I),Oi(i=1,···,I)被映射成若干个feature map(共假设J),Qj(j=1,···,J)在卷积层中基于多个局部滤波器(总共I×J), wij (i=1,···,I;j=1,···,J) . 该映射可以表示为信号处理中众所周知的卷积运算。假设输入特征图都是一维的,卷积层中一个特征图的每个单元可以计算为方程(1)(上面的方程)。

其中oi,m是第i个输入特征图O_i的第m个单元q_{j,m}卷积层的第j个特征图Q_j的第m个单元, w_{ i,j,n}是权重向量的第n个元素w_{i,j},将输入的第i个特征图连接到卷积层的第j个特征图,F称为滤波器大小这是卷积层的每个单元接收的输入带的数量。iOiqj,mmjQjwi,j,nnwi,jijF

到现在为止还挺好:

我基本上从中理解的是我试图在这张图片中说明的内容。

在此处输入图像描述

在我看来,他们正在做的实际上是处理直到 F 的所有数据点,以及所有特征图。基本上在两个 xy 方向上移动,并据此计算点。

的二维图像上使用等于图像大小的滤波器进行的二维卷积吗?重量似乎根本没有区别在这里有任何重要性..?(IxF)

1个回答

它类似于2D 图像上极其特殊的卷积步骤。也就是说,它类似于具有一个图像(例如,如果我们谈论的是输入,则为黑白图像),并且您选择使用大小为个过滤器,它跨越图像的整个宽度,并且只沿着长度跨步创建个特征图。这里的限制是:N×IJF×IJ(NF+1)×1.

-“图像”(或您正在处理的当前图层)必须只有一个特征图

- 过滤器跨越图像的整个宽度,因此它们不会沿着该方向跨步,并且生成的特征图的宽度为1.

结果特征图重新解释为单个图像,然后为下一个卷积层(或更多如果您正在进行池化,则会受到限制)。(NF+1)×1(NF+1)×J

所以是的,类比是存在的,但它只是类似于二维图像阵列上非常有限的卷积类,我认为这不是很有用。它将用于的应用程序类型是黑白图像,您不关心沿某个维度的平移不变性。

图像上的 CNN 比这个类比所允许的灵活得多的原因是,图像 CNN 的输入对象(以及每个相应的隐藏层)是一个 3D 数组,而不是本例中的 2D 数组。第三维是特征图(例如输入图像的 RGB 值)。然后,您可以允许过滤器在两个维度上都是任意大小,并沿着两个方向大步前进。当涉及到 CNN 的 2D 输入时,我更愿意保留文本解释。