卷积神经网络

数据挖掘 神经网络 特征提取 卷积 特征构造
2022-02-13 14:46:04

大家好:关于 CNN 的工作原理,我有一个非常基本的问题。

我完全理解训练过程是拍摄一堆图像,从随机过滤器开始,卷积,激活,计算损失,反向传播和学习权重。完全明白。

但是一旦训练完成,最后一个卷积层就具有最复杂和最完整的特征,例如面部、耳朵、轮子和可以被完整特征激活的过滤器。

如果是这样,在测试期间,我们是否需要将图像再次通过所有层?为什么我们不将我们的图像与最后一个卷积层进行卷积,看看有多少这些复杂的特征过滤器被激活?并将其传递给全连接层进行分类?

我知道层和输入中可能存在不一致,但除了更重要的之外?

1个回答

为什么我们不将我们的图像与最后一个卷积层进行卷积,看看有多少这些复杂的特征过滤器被激活?

答案是所有层都完全依赖于前一层的确切特征。最后一层根本无法将原始图像作为输入并输出有意义的值。很可能它甚至无法适应输出的形状,它需要几十个通道,而彩色图像只有 3 个。如果你以某种方式强迫它适应,那么彩色图像数据对它。它可能仍然会输出一些东西,但它本质上是胡言乱语,与期望的结果无关。

每一层都是前一层的函数。忽略卷积的细节,神经网络本质上是多个函数的组合(例如,我们称它们为),因此:f,g,h,i,j

y=j(i(h(g(f(x))))

您本质上是在这里问,您是否可以只执行而不是按顺序运行所有这些函数。答案是否定的。y=j(x)