我发现的所有使用深度信念或卷积神经网络的示例都将它们用于图像分类、字符检测或语音识别。
深度神经网络是否也适用于特征不结构化(例如,不按序列或网格排列)的经典回归任务?如果是,你能举个例子吗?
我发现的所有使用深度信念或卷积神经网络的示例都将它们用于图像分类、字符检测或语音识别。
深度神经网络是否也适用于特征不结构化(例如,不按序列或网格排列)的经典回归任务?如果是,你能举个例子吗?
图像的特征使得它们可以通过深度神经网络进行分类,它有大量的特征(可能有数百万甚至数十亿像素的 RGB、强度等),如果你有准确的标签,它就不是嘈杂的数据。这些天的相机非常好,它们不会错误地测量任何东西。多亏了互联网,我们现在有了很多准确标记的图像。深度网络可以表达任意复杂的函数,这对于噪声数据来说是一个问题,因为你很容易过度拟合噪声,这就是为什么许多学习方法倾向于惩罚复杂模型的原因。然而,在图像识别的情况下,真正的函数似乎实际上很复杂,我们不知道函数形式是什么样的,在很多情况下我们甚至不知道相关的特征是什么。
这并不意味着您不能使用深度网络来学习与图像无关的功能。你只需要非常小心它的缺点,主要是它很容易过度拟合,而且它的计算成本很高并且可能需要很长时间来训练(现在并行化的 SGD 和 GPU 并不是一个问题)。另一个缺点是您几乎没有模型可解释性,这对于图像分类并不重要。我们只是想让计算机识别黑猩猩和猩猩之间的区别。人类对公式的理解并不重要。对于其他领域,尤其是医学诊断、政策研究等,您希望甚至可能需要人类理解。
当然,除了图像或语音识别之外,您还可以使用深度神经网络解决许多问题。问题是如果你真的需要它。
深度神经网络比简单的 MLP 强大得多,但它们也占用更多资源并且更难以开发。因此,它们用于非常复杂的领域。您可以使用它们来解决更简单的问题,但通常更简单的模型也会获得良好的结果。
使用深度神经网络解决简单问题就像用火箭筒杀死苍蝇一样,你肯定会杀死它们,但你找不到更简单的方法吗?
我同意大卫的回答。但我也认为深度神经网络在图像上的应用是图像(更重要的是,标记图像)收集起来相对便宜。在其他领域,大规模收集数据可能非常昂贵,尤其是在典型工业或政府企业的限制下。使这个问题更加复杂的是,在许多应用程序中,感兴趣的现象相对较少,因此可以学习的示例很少,因此即使是相对大规模的数据收集工作也可能会产生某个类的少数成员。