如果我理解正确的话,在机器学习算法中,模型必须从它的经验中学习,即当模型对新案例给出错误的预测时,它必须适应新的观察,并且随着时间的推移,模型变得越来越好. 我看不出逻辑回归有这个特点。那么为什么它仍然被视为一种机器学习算法呢?就“学习”而言,逻辑回归与正常回归有什么区别?
我对随机森林有同样的问题!
“机器学习”的定义是什么?
如果我理解正确的话,在机器学习算法中,模型必须从它的经验中学习,即当模型对新案例给出错误的预测时,它必须适应新的观察,并且随着时间的推移,模型变得越来越好. 我看不出逻辑回归有这个特点。那么为什么它仍然被视为一种机器学习算法呢?就“学习”而言,逻辑回归与正常回归有什么区别?
我对随机森林有同样的问题!
“机器学习”的定义是什么?
机器学习很热门,而且是赚钱的地方。人们将他们试图出售的东西称为当下热门的东西,因此“出售”。那可以是销售软件。这可能是将自己推销为试图升职的现有员工、潜在员工、顾问等。这可能是经理试图从公司大佬那里获得预算批准以雇用人员和购买东西,或说服投资者投资他/她的热门新创业公司将机器学习作为改进色情应用程序的关键。所以软件做机器学习,人们是机器学习专家,因为那是热门的东西,所以卖的东西……至少现在是这样。
30 多年前,我做过各种线性和非线性统计模型拟合。当时还不叫机器学习。现在,大部分都是。
就像每个人和他们的叔叔现在都是数据“科学家”一样。这很热,据说很性感,所以这就是人们所说的自己。这就是必须获得预算批准才能雇用某人的招聘经理列出的职位。因此,对数学、概率、统计、优化或数值/浮点计算一无所知的人使用 R 或 Python 包,其实现的正确性和鲁棒性存在问题,并被标记为机器学习算法,应用于他们不理解的数据,并根据他们在这方面的经验称自己为数据科学家。
这可能听起来轻率,但我相信这是情况的本质。
编辑:以下是 2019 年 9 月 26 日发布的推文:
https://twitter.com/daniela_witten/status/1177294449702928384
Daniela Witten @daniela_witten “当我们筹集资金时,它是人工智能,当我们雇用它时,它是机器学习,而当我们开展工作时,它是逻辑回归。”
(我不确定是谁想出了这个,但它是一颗宝石💎)
机器学习不是一个定义明确的术语。
事实上,如果你用谷歌搜索“机器学习定义”,你得到的前两件事是完全不同的。
来自WhatIs.com,
机器学习是一种人工智能 (AI),它为计算机提供了无需明确编程的学习能力。机器学习专注于开发计算机程序,这些程序可以在接触新数据时自学成长和改变。
来自维基百科,
机器学习探索可以从数据中学习和预测的算法的构建和研究。
逻辑回归无疑符合 Wikipedia 的定义,您可以争论它是否符合 WhatIs 的定义。
我个人像维基百科一样定义机器学习,并将其视为统计数据的一个子集。
正如其他人已经提到的那样,统计、机器学习、人工智能等之间没有明确的区别,所以对任何定义都持保留态度。逻辑回归可能更常被标记为统计而不是机器学习,而神经网络通常被标记为机器学习(尽管神经网络通常只是逻辑回归模型的集合)。
在我看来,机器学习研究可以以某种方式从数据中学习的方法,通常是通过构建某种形状或形式的模型。逻辑回归,如 SVM、神经网络、随机森林和许多其他技术,在构建模型时确实从数据中学习。
如果我理解正确,在机器学习算法中,模型必须从其经验中学习
这并不是机器学习通常的定义方式。并非所有机器学习方法都会产生动态适应新数据的模型(这个子领域称为在线学习)。
就“学习”而言,逻辑回归与正常回归有什么区别?
许多回归方法也被归类为机器学习(例如 SVM)。
逻辑回归由统计学家 DR Cox 于 1958 年发明,因此早于机器学习领域。谢天谢地,逻辑回归不是一种分类方法。它是一个直接概率模型。
如果您认为算法必须具有两个阶段(初始猜测,然后“纠正”预测“错误”),请考虑以下几点:逻辑回归第一次就正确了。也就是说,在加法(在 logit 中)模型的空间中。逻辑回归是许多机器学习方法的直接竞争对手,并且在预测变量主要作用于加法(或当主题知识正确地预先指定交互作用时)时优于其中许多方法。有些人称逻辑回归是一种机器学习,但大多数人不会。你可以调用一些机器学习方法(神经网络就是例子)统计模型。