应用于图像和应用于其他数值二维数据的卷积运算之间有什么区别吗?

人工智能 卷积神经网络 分类 图像识别 卷积
2021-11-12 10:59:08

应用于图像和应用于其他数值二维数据的卷积运算之间有什么区别吗?

例如,我们有一个相当不错的 CNN 模型,在许多64×64图像来检测两个类别。另一方面,我们有很多64×64数值二维矩阵(不被视为图像),它也有两个类。我们可以使用相同的 CNN 模型对数值数据集进行分类吗?

2个回答

简短的回答是否定的。您不能使用为一项任务训练的模型来预测完全不同的任务。即使第二个任务是另一个图像分类任务,CNN 也必须进行微调才能使新数据正常工作。

有几点需要注意...

1) CNN 因其性质而适用于图像。它们不一定适用于任何二维输入。

2)通过二维数值数据,我假设您不是表格数据

提供一点理论,CNNs 适用于许多图像任务,因为它们处理空间局部信息,不太关心绝对位置。本质上,每一层都将每张图像分割成微小的作物图像,并对作物进行分析。“这是一条线……角……眼睛……脸吗?”这样简单的问题。可以平等地询问每一种作物。

这意味着网络只需要学习一次来检测一个特征,而不是单独学习在它可能出现的每个可能位置检测该特征。因此,与完全连接的架构相比,我们可以使用训练速度更快且所需数据更少的较小网络。

回到这个问题,如果您的数据具有类似的空间相关性,您可以期望 CNN 能够工作。换句话说,如果在单元格 x、y 周围找到一个模式,则与单元格 a、b 中的相同模式具有相同的含义,那么您可能很幸运。另一方面,如果每一列都代表一个有意义的不同概念,那么 CNN 将是一个糟糕的架构选择。