机器学习的定义是什么?机器学习有什么优势?
什么是机器学习?
什么是机器学习?
机器学习 (ML) 已由多人以相似(或相关)的方式定义。
Tom Mitchell 在他的《机器学习》 (1997)一书中定义了一个机器学习算法/程序(或机器学习器)如下。
据说计算机程序可以从经验中学习 关于某类任务和绩效衡量, 如果它在任务中的表现,如测量, 随着经验的提高.
这是一个相当合理的定义,因为它描述了梯度下降、Q-learning 等算法。
在他的《机器学习:概率视角》(2012 年)一书中,Kevin P. Murphy 将机器学习领域/领域定义如下。
一组方法,可以自动检测数据中的模式,然后使用发现的模式来预测未来的数据,或者在不确定的情况下执行其他类型的决策(例如计划如何收集更多数据!)
在不提及算法或领域的情况下,Shai Shalev-Shwartz 和 Shai Ben-David将机器学习定义如下
机器学习一词是指自动检测数据中有意义的模式。
在所有这些定义中,核心概念是数据或经验。因此,任何自动检测数据中的模式(任何形式,例如文本、数字或分类)以解决某些任务/问题(通常涉及更多数据)的算法都是(机器)学习算法。
这个定义的棘手部分,经常导致很多关于 ML 是什么或可以做什么的误解,可能是自动的:这并不意味着学习算法是完全自主的或独立于人类的,因为人类,在大多数情况下在这种情况下,仍然需要定义一个性能度量(和其他参数,包括学习算法本身),以指导学习算法朝着正在解决的问题的一组解决方案。
作为一个领域,ML 可以定义为 ML 算法的研究和应用(由 Mitchell 的定义定义)。
子类别
Murphy 和许多其他人经常将机器学习分为三个主要子类别
监督学习(或预测),目标是从输入中学习映射输出,给定一组带标签的输入-输出对
无监督学习(或描述性),目标是在数据中找到“有趣的模式”
强化学习,这对于学习在偶尔给予奖励或惩罚信号时如何行动或行为很有用
但是,机器学习技术还有许多其他可能的子类别(或分类法),例如
- 深度学习(即使用神经网络来逼近函数和相关的学习算法,例如梯度下降)或
- 概率机器学习(提供不确定性估计的机器学习技术)
- 弱监督学习(即标签信息可能不完全准确的 SL)
- 在线学习(即一次从单个数据点学习,而不是从多个数据点的数据集中学习)
这些子类别也可以组合起来。例如,深度学习可以在线或离线进行。
相关领域
还有一个相关领域称为计算(或统计)学习理论,它涉及学习理论(从计算和统计的角度来看)。因此,在这个领域中,我们对诸如“我们需要多少样本才能近似计算具有一定误差的函数?”之类的问题感兴趣。
当然,鉴于机器学习是一组数据或经验驱动的算法和技术,人们可能想知道机器学习和统计之间的区别是什么。事实上,在很多情况下,它们非常相似,ML 采用了很多统计概念,你甚至可能在网上看到机器学习只是美化了的统计。ML 和统计通常解决相同的问题,但从不同的角度或略有不同的方法(并且术语可能会从一个领域到另一个领域略有变化)。如果您对它们之间的差异的更详细解释感兴趣,您可以阅读Danilo Bzdok 等人的Statistics vs machine learning (2018)。
机器学习有什么用?
ML 可以潜在地用于(至少部分地)自动化涉及数据和模式识别的任务,这些任务以前只能由人类执行(例如,从一种人类语言(如英语)翻译成另一种人类语言(如意大利语))。但是,机器学习不能自动化所有任务:例如,它不能从数据中推断出因果关系(这通常必须由人类完成),除非您将因果推断作为机器学习的一部分。如果你对因果推理感兴趣,你可以看看 Judea Pearl 的论文Causal Inference(图灵奖,表彰他在因果推理方面的工作!)。
这是 Tom Mitchel (1997) 的定义:
如果计算机程序在 T 上的性能(由 P 衡量)随着经验 E 的提高而提高,则可以说计算机程序从经验 E 中学习某些任务 T 和某些性能度量 P。
因此,程序员向计算机提供一些指令/规则,以便它可以自己学习如何从给定的示例中解决问题。
在某些任务中,计算机可以比人类执行得更好。例如,Dota 2 机器人(由 OpenAI 制造)击败了世界冠军。
通过机器学习,许多案例可以自动化。他们还能够通过不时学习给定的数据来改进解决方案。它可以很好地处理和分析大数据。
机器学习已经在许多领域得到应用,例如谷歌翻译中的机器翻译和当今社会广泛用于安全的人脸识别。