CNN 的模式识别能力是否仅限于图像处理?

人工智能 深度神经网络 神经网络 图像识别 卷积神经网络
2021-10-22 19:52:09

卷积神经网络能否用于没有图像数据的问题域中的模式识别?例如,通过以具有空间关系的类似图像的格式表示抽象数据?那总是效率低下吗?

该开发人员表示,当前的开发可能会更进一步,但如果图像识别之外存在限制,则不会。

4个回答

卷积网络 (CNN) 依赖于数学卷积(例如 2D 或 3D 卷积),通常用于信号处理。图像是一种信号,卷积同样可以用于声音、振动等。因此,原则上,CNN 可以找到任何信号的应用,甚至更多。

在实践中,已经有 NLP 方面的工作(正如 Matthew Graves 所提到的),其中一些人使用 CNN 而不是递归网络来处理文本。其他一些作品适用于声音处理(这里没有参考,但我尚未发表的工作正在进行中)。


原文内容:回答原题的问题,现在改了。或许需要删除这一项

对抗性网络(及相关)的研究表明,即使是深度网络也很容易被愚弄,导致它们在人类观察狗(或任何物体)时看到的随机噪声(文章中有明确的例子)。

另一个问题是神经网络的泛化能力。卷积网络以其比其他技术更好的泛化能力令世界惊叹。但是,如果网络只输入猫的图像,它将只识别猫(并且可能到处都能看到猫,就像对抗性网络的结果一样)。换句话说,即使是 CN 也很难概括超出他们所学到的东西。

识别界限很难准确定义。我只想说学习数据的多样性推动了极限(我认为进一步的细节应该会导致更合适的讨论场所)。

简单的答案是“不,它们不仅限于图像”:CNN 也被用于自然语言处理。(有关介绍,请参见此处。)

我还没有看到它们应用于图形数据,但我还没有看过;有一些显而易见的事情可以尝试,所以我很乐观它会奏效。

卷积神经网络不仅可以应用于图像识别,还可以应用于视频分析和识别、自然语言处理、游戏(例如围棋),甚至通过预测分子和生物蛋白质之间的相互作用来发现药物

因此,它可以通过使用连接到更全连接层的卷积和子采样层来解决各种问题。它们更容易训练,因为与具有相同隐藏单元数量的全连接网络相比,它们的参数更少。超低密度脂蛋白

卷积神经网络可以用于模式是局部相关和可翻译的(如可移动的)。之所以如此,是因为 CNN 包含过滤器,这些过滤器会在输入中到处寻找特定的局部模式。您会在图片、文本、时间序列等中找到本地和可翻译的模式。

如果您的数据更像是一组具有不相关顺序的特征,那么使用 CNN 就没有多大意义。在这种情况下,您可能无法检测包含在输入向量中相距较远的特征的模式。如果您可以在不丢失信息的情况下重新排序输入向量的数据点,您将不会在数据中找到本地和可翻译的模式。