机器学习中模型的定义

数据挖掘 机器学习
2021-09-14 04:47:08

这个定义并不完全适用,因为我们并不总是假设一个基础分布。那么模型到底是什么?具有指定超参数的梯度提升模型 (GBM) 可以被视为模型吗?模型是规则的集合吗?

4个回答

我最近对同样的问题感兴趣,并意识到在机器学习中没有单一的“模型”定义。它高度依赖于您所咨询的资源,可能是特定软件程序的文档、其用户社区采用的俚语或已发表学术论文中使用的定义,这些定义因期刊而异。此外,我必须记住,这些论文不仅是由机器学习专家撰写的,而且是由需要应用机器学习技术(如成像、各种医学领域等)的其他学科的专家撰写的。 . 他们中的许多人没有明确定义术语“模型”,该术语经常被松散地使用。这只是我对“模型”的几个不同定义

• 统计模型,特别是与概率分布相关的统计数据。

• 回归数据和相关统计数据。

• 上面Neil Slater 提到的数学模型。

• 机器学习中使用的数据模型,例如所涉及的列、它们的数据类型、数据源和其他元数据。这特别棘手,因为与我列出的前三个不同,这个定义根本没有数学上的东西。例如,请参阅 SQL Server“挖掘模型”的所有文档,这些文档为机器学习提供双重任务。

• 有时,上述所有定义都被扩展为包括建立在方程和元数据之上的机器学习结构,例如神经网络的规范。在其他情况下,这些被视为单独的实体。

以上所有内容有时会混合并匹配在一起,具体取决于来源。我确信还有其他关于“模型”的定义我已经从这个列表中删除了,这会使事情变得更加复杂。为了处理这种歧义,我试图训练自己在作者使用“模型”一词时判断他们的意图。有时根据作者工作的背景或领域很容易确定,但有时我必须深入阅读一篇文章或文档才能弄清楚。我希望我能更明确一点,但这确实是一个自然模糊的术语;永远不会有一个简单的一刀切的答案。我希望这会有所帮助。

来自关于亚马逊机器学习的文章

训练 ML 模型的过程涉及为 ML 算法(即学习算法)提供训练数据以供学习。The term ML model refers to the model artifact that is created by the training process.

我喜欢Tom Mitchell给出的机器学习定义

如果计算机程序在 T 中的任务上的性能(由 P 衡量)随着经验 E 而提高,则可以说计算机程序从经验 E中学习某类任务 T性能度量P。

所以,给定这个定义,我应该说模型是完成某项任务 T 后获得的经验。

松散地说,模型是对某些事物或过程的简化。例如,地球的形状实际上并不是一个球体,但如果我们正在设计一个地球仪,我们可能会将其视为一个球体。同样,假设宇宙是确定性的,有一些自然过程可以确定客户是否会在网站上购买产品。我们可能会构建一个近似于该过程的东西,我们可以提供一些关于客户的信息,并告诉我们它是否认为客户会购买产品。

因此,“机器学习模型”是由机器学习系统构建的模型。

(抱歉这不是一个严格的答案,但我希望这仍然有用。)