分类器 vs 模型 vs 估计器

机器算法验证 机器学习
2022-01-18 00:00:48

分类器,模型和估计器之间有什么区别?

据我所知:

  • 估计器是从回归算法中找到的预测器
  • 分类器是从分类算法中找到的预测器
  • 模型既可以是估计器,也可以是分类器

但是从网上看,似乎我可能混淆了这些定义。那么,在机器学习的背景下,真正的定义是什么?

2个回答
  • 估计器:这不是一个有严格定义的词,但它通常与在数据中查找当前值有关。如果我们没有明确计算我们口袋里的零钱,我们可能会使用一个估计值。也就是说,在机器学习中,它最常与参数估计或密度估计结合使用。在这两种情况下,都假设我们当前拥有的数据以可以用函数描述的形式出现。通过参数估计,我们认为该函数是具有附加参数(例如速率或均值)的已知函数,我们可以估计这些参数的值。在密度估计中,我们甚至可能没有关于函数的假设,但无论如何我们都会尝试估计函数。一旦我们有了估计,我们就可以使用一个模型。最大似然
  • 分类器:这专门指一种函数(以及该函数的使用),其中响应(或函数语言中的范围)是离散的。与此相比,回归器将具有连续响应。还有其他响应类型,但这是最著名的两种。一旦我们建立了一个分类器,它就可以在有限的类别范围内为我们预测数据向量可能指示的类别。作为示例,语音识别软件可以记录会议并尝试在任何给定时间记录有限数量的会议参加者中的哪一个正在讲话。构建这个软件,我们会给每个与会者一个只是名义上的数字,并尝试为每个语音片段分类到该数字。
  • 模型:模型是您可以接受或拒绝代表您的现象的函数(或合并的函数集)。这个词源于您可以应用领域知识来解释/预测现象的想法,尽管这不是必需的。非参数模型可能完全来自手头的数据,但结果通常仍称为模型。这个术语强调了这样一个事实,即在构建模型时所构建的不是现实,而只是现实的“模型”。正如 George Box 所说“所有模型都是错误的,但有些模型是有用的”。拥有一个模型可以让您进行预测,但这可能不是它的目的;它也可以用来模拟或解释。

估计器是从数据中学习的任何对象;它可能是分类、回归或聚类算法,或者是从原始数据中提取/过滤有用特征的转换器。

来自 scikit-learn 文档。