神经网络是统计模型吗?

人工智能 神经网络 机器学习 深度学习 术语 统计人工智能
2021-10-21 05:23:58

通过阅读神经网络和统计模型论文的摘要,似乎人工神经网络是统计模型。

相比之下,机器学习不仅仅是美化统计

我正在寻找一个更简洁/总结的答案,重点是 ANN。

2个回答

根据维基百科:

统计模型是一种数学模型,它体现了一组关于生成样本数据(以及来自更大群体的类似数据)的统计假设。统计模型通常以相当理想化的形式表示数据生成过程。

回答你的问题:

为了构建任何神经网络模型,我们假设训练、测试和验证数据来自概率分布。因此,如果您根据统计数据生成神经网络模型,那么该网络就是统计模型。

此外,神经网络的成本函数通常是参数模型,参数模式是统计模型。

请查看 Goodfellow 的深度学习书籍章节深度前馈网络第 174 和 175 页。

来自Goodfellow的书

幸运的是,神经网络的成本函数或多或少与其他参数模型(例如线性模型)的成本函数相同。在大多数情况下,我们的参数模型定义了一个分布p(yx;θ)我们简单地使用最大似然原理。

总之,人工神经网络(例如 MLP、CNN 等)是统计模型

什么是统计模型?

根据 Anthony C. Davison(在Statistical Models一书中)的说法,统计模型是一种概率分布,可以用来进行推断或根据数据做出决策。概率分布代表数据的可变性。

神经网络是统计模型吗?

神经网络是否构建或表示了一个概率分布,可以从数据中得出推论或做出决策?

用于二进制分类的 MLP

例如,可以将经过训练以解决二进制分类任务的多层感知器 (MLP) 视为概率分布模型P(yx;θ). 事实上,有很多 MLP 的例子,使用 softmax 或 sigmoid 函数作为输出层的激活函数,以产生概率或概率向量。然而,需要注意的是,尽管许多神经网络产生概率或概率向量,但概率分布并不是一回事。单独的概率并不能描述完整的概率分布。然而,例如,如果你让你的神经网络产生一个概率,即模型P(y=1x;θ),至少在二元分类的情况下,您显然可以推导出另一个标签的概率,如下所示:P(y=0x;θ)=1P(y=1x;θ). 无论如何,在这个例子中,你只需要参数p=P(y=1x;θ)定义相关的伯努利分布

因此,这些神经网络(用于二元分类)在给定数据的情况下建模和学习一些概率分布以进行推断或预测,可以被认为是统计模型。

生成模型

变分自动编码器 (VAE) 构建概率分布(例如,高斯或P(x)表示图像上的概率分布,如果要生成图像),因此可以将 VAE 视为统计模型。

贝叶斯神经网络

还有贝叶斯神经网络,它们是为神经网络的每个单元(或神经元)维持一个概率分布(通常是高斯分布)的神经网络,而不仅仅是一个点估计。因此, BNN可以被视为统计模型。

感知器

感知器可以被认为是“统计模型”,因为它从数据中学习,但它不产生任何概率向量或分布,即它不是概率模型/分类器。

结论

因此,神经网络是否是统计模型取决于您对统计模型的定义以及您将考虑使用哪些机器学习模型。如果您对统计模型的更正式定义感兴趣,请查看这篇论文

参数与非参数

统计模型通常也分为参数模型和非参数模型。神经网络通常被归类为非参数,因为它们比线性回归模型(参数)做出的假设更少,并且通常更普遍适用,但我不会详述这个话题。