“学习模型”一词从何而来

机器算法验证 分类 数据挖掘 术语 模型
2022-03-16 10:29:12

我经常听到这里的数据挖掘者使用这个术语。作为从事分类问题工作的统计学家,我熟悉“训练分类器”这个术语,并且我认为“学习模型”的含义相同。我不介意“训练分类器”这个词。这似乎描绘了拟合模型的想法,因为训练数据用于获得模型参数的良好或“改进”估计。但是会学习意味着获得知识。用简单的英语“学习模型”意味着知道它是什么。但事实上我们从来没有“知道”模型。模型接近现实,但没有模型是正确的。就像 Box 说的“没有模型是正确的,但有些模型是有用的”。

我很想听听数据挖掘者的回应。这个词是怎么来的?如果你使用它,你为什么喜欢它?

3个回答

我怀疑它起源于人工神经网络研究社区,其中神经网络可以被认为是通过修改突触权重来学习数据模型,其方式类似于我们自己学习时发生在人脑中的方式经验。我的研究生涯始于人工神经网络,所以我有时会使用这个短语。

如果您认为模型被编码在模型的参数中而不是方程中,也许更有意义,就像心理模型不是大脑的可识别物理组件而是一组参数一样我们的一些神经元的设置。

请注意,这并不意味着心智模型也一定是正确的!

这个词在人工智能中已经相当古老了。图灵在他 1950 年的《计算机与智能》论文中花了很长的篇幅讨论“学习机器” 并定性地勾勒出监督学习。Rosenblatt 的原始论文:The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain论文 1958 年广泛讨论了“学习的数学模型”。在这里,感知器是一个“学习模型”;模型没有“学习”。

Pitts 和 McCullough 1943 年的论文——最初的“神经网络”论文——并不真正关心学习,更多的是如何构建逻辑演算(如希尔伯特或根岑系统,但我认为他们指的是 Russell/Whitehead)可以进行推理。我认为是“感知器”论文引入了数字,而不是在这一传统中学习的象征性概念。

机器是否有可能仅从示例中学习如何下棋?是的。它有下棋的模型吗?是的。它是最佳模型(假设有一个)吗?几乎可以肯定不是。用简单的英语来说,如果我能下国际象棋,我就“学过国际象棋”——或者说得很好。这并不意味着我是最佳棋手。这就是图灵在论文中讨论学习国际象棋时所描述的“学习”的含义。

我与我使用的术语非常不一致。因此(例如)对于极限学习我会说“识别”,对于 SVM 学习我会说“训练”,但对于 MCMC-“学习”我会说“优化”。例如,我只是将回归称为“回归”。

作为 Bioplausible Machine Learning 的研究人员,我强烈同意“没有模型是正确的,但有些模型是有用的”,事实上,模型和形式主义有很大的失败,正如那些谈论问题优化的作者所使用的那样,当他们在做什么时正在优化模型,即探索其参数空间并找到局部或希望全局最优值。对于实际问题,这通常不是最优的。虽然模型的创建者通常使用正确的术语,并公开所有假设,但大多数用户掩盖了通常不知道的假设,并且还使用了不太精确的关于“学习”和“优化”和“参数化”。

我认为模型的这种最佳参数化是人们在机器学习中的意思,特别是在监督机器学习中,虽然我不能说我听说过很多“学习模型”——但它确实发生了,而人训练模型,计算机学习模型的参数。即使在无监督学习中,“学习”通常只是模型的参数化,因此希望“学习模型”是模型的最佳参数化(尽管搜索参数空间的不同方法通常会找到不同的解决方案,即使它们可以被证明优化同一件事)。我确实宁愿使用“训练模型”

事实上,我的大部分研究都是关于学习模型,以发现更好的模型,或者在计算和认知/生物学/生态学上更合理的模型。