主动学习和强化学习有什么区别?

数据挖掘 机器学习 强化学习 主动学习 不同之处
2021-09-16 04:54:14

来自维基百科:

主动学习是机器学习的一种特殊情况,其中学习算法可以交互地查询用户(或其他一些信息源)以用所需的输出标记新数据点。

强化学习 (RL) 是机器学习的一个领域,它关注软件代理应该如何在环境中采取行动以最大化累积奖励的概念。

如何区分它们?确切的区别是什么?

2个回答

主动学习是一种应用于监督学习设置的技术。在监督学习范式中,您通过提供输入和预期输出(标签)来训练系统。系统学习模仿训练数据,理想情况下将其推广到看不见但可推断的情况。主动学习通常应用于获取标签成本高昂的情况,因此我们动态获取新标签,定义算法策略以最大化新数据点的有用性。

强化学习是一种不同的范式,我们没有标签,因此不能使用监督学习。我们有一个“强化信号”而不是标签,它告诉我们正在训练的系统的当前输出“有多好”。因此,在强化学习中,系统(理想情况下)会学习一种策略来获得尽可能好的奖励。

主动学习是基于这个概念,如果一个学习算法可以选择它想要学习的数据,它可以比传统方法表现得更好,而且训练的数据要少得多。所以这是一种半监督机器学习。

强化学习是一种机器学习技术,它使代理能够在交互式环境中使用来自其自身行为和经验的反馈,通过反复试验来学习。它基于可以主动和被动的奖惩机制。

在被动 RL 的情况下,代理的策略是固定的,这意味着它被告知要做什么。与此相反,在主动 RL 中,代理需要决定要做什么,因为它没有可以采取行动的固定策略。因此,被动 RL 代理的目标是执行固定策略(动作序列)并对其进行评估,而主动 RL 代理的目标是采取行动并学习最佳策略。

因此,主动学习更像是一个概念,而强化学习是一种解决问题的方法,如本文所示

参考: