卷积神经网络能否用于没有图像数据的问题域中的模式识别?例如,通过以具有空间关系的类似图像的格式表示抽象数据?那总是效率低下吗?
该开发人员表示,当前的开发可能会更进一步,但如果图像识别之外存在限制,则不会。
卷积神经网络能否用于没有图像数据的问题域中的模式识别?例如,通过以具有空间关系的类似图像的格式表示抽象数据?那总是效率低下吗?
该开发人员表示,当前的开发可能会更进一步,但如果图像识别之外存在限制,则不会。
卷积网络 (CNN) 依赖于数学卷积(例如 2D 或 3D 卷积),通常用于信号处理。图像是一种信号,卷积同样可以用于声音、振动等。因此,原则上,CNN 可以找到任何信号的应用,甚至更多。
在实践中,已经有 NLP 方面的工作(正如 Matthew Graves 所提到的),其中一些人使用 CNN 而不是递归网络来处理文本。其他一些作品适用于声音处理(这里没有参考,但我尚未发表的工作正在进行中)。
原文内容:回答原题的问题,现在改了。或许需要删除这一项。
对抗性网络(及相关)的研究表明,即使是深度网络也很容易被愚弄,导致它们在人类观察狗(或任何物体)时看到的随机噪声(文章中有明确的例子)。
另一个问题是神经网络的泛化能力。卷积网络以其比其他技术更好的泛化能力令世界惊叹。但是,如果网络只输入猫的图像,它将只识别猫(并且可能到处都能看到猫,就像对抗性网络的结果一样)。换句话说,即使是 CN 也很难概括超出他们所学到的东西。
识别界限很难准确定义。我只想说学习数据的多样性推动了极限(我认为进一步的细节应该会导致更合适的讨论场所)。
简单的答案是“不,它们不仅限于图像”:CNN 也被用于自然语言处理。(有关介绍,请参见此处。)
我还没有看到它们应用于图形数据,但我还没有看过;有一些显而易见的事情可以尝试,所以我很乐观它会奏效。
卷积神经网络可以用于模式是局部相关和可翻译的(如可移动的)。之所以如此,是因为 CNN 包含过滤器,这些过滤器会在输入中到处寻找特定的局部模式。您会在图片、文本、时间序列等中找到本地和可翻译的模式。
如果您的数据更像是一组具有不相关顺序的特征,那么使用 CNN 就没有多大意义。在这种情况下,您可能无法检测包含在输入向量中相距较远的特征的模式。如果您可以在不丢失信息的情况下重新排序输入向量的数据点,您将不会在数据中找到本地和可翻译的模式。