你把不断学习的机器学习系统称为什么?

人工智能 神经网络 深度学习 术语 增量学习
2021-10-26 22:45:23

我从这个视频讲座中了解到,深度学习分为三种类型:

  • 监督
  • 无监督
  • 加强

所有这些都可以仅在其部署之前或其运行期间用于训练神经网络。

对于后一种情况,这里这里被称为持续学习,在这里这里被称为动态学习

我应该使用哪个术语来指代不断学习(即使在部署之后)的机器学习算法?如果它是“连续的”,对于那些在部署之前停止学习的系统,是否有相反的术语(例如“动态”的“静态”)?

3个回答

与此类系统相关的术语或表达方式有多种,例如在线学习增量学习持续学习持续学习终身学习它们有时可以互换使用,但其中一些含义略有不同。例如,在线学习不需要是增量的,它指的是试图不忘记以前学习的信息的算法。

线上的对立面是线下。然而,表达批学习有时被用作在线学习的反义词。

在人工智能这样蓬勃发展的领域中,许多术语尚未完全确立,在某些领域,社区就特定技术的特定术语达成一致还需要更多时间。

因此,目前可能无法对您的问题给出明确的答案。但重要的是要注意,您提供的参考资料并不都在谈论操作过程中的相同类型的学习这为深入研究该主题提供了线索。

在操作过程中学习最简单的方法是简单的强化学习。Deepmind 的 DQN 就是这样工作的。它尝试不同的动作,并通过奖励功能接收反馈来了解什么是有效的。不一定有单独的学习和工作阶段。随着时间的推移,人工智能会变得更好。这意味着,NN 会不断适应手头的挑战,如果挑战发生变化,它会随着时间的推移接受新的挑战,并“忘记”以前有效的方法,如果这种旧策略不再有效。

您对 Deepmind 的首次提及涉及遗忘方面。当谈到持续学习时,它也可能意味着系统不会忘记以前的技能,但可以在学习完全不同的东西后利用它们。这需要更先进的人工智能架构。这种方法并不意味着神经网络必须在操作过程中不断学习。它可以在训练期间使用这种技术,一旦成功就停止学习。

还有第三个领域,递归网络,它不会以直接的方式将信息从一个神经元传递到另一个神经元,但可以包含控制信息流的循环或其他类型的门。这种架构通常比普通的神经网络更复杂,但更类似于动物大脑的工作。在该领域中,经常使用术语动态。

因此,当您想说 NN 在生产过程中不断学习时,我会说您正在寻找的术语是持续学习- 我还阅读了此类 NN 的在线学习。术语动态对于递归或其他更复杂类型的 NN 更常见,并且在我看来更适合那里。

为了结束我的回答,我需要跳回到开头。AI领域的很多名词都没有最终确定。因此,我的分析只是对我在不同出版物和讲座中看到的趋势的总结,在未来几年一定不能成立。希望它仍然有帮助。

ML 作为一个相对年轻且发展迅速的领域,对于许多概念有许多(接近)同义词。

一个范式差异是一个模型是从一组静态的、预定义的数据中学习的,还是随着时间的推移向它提供新数据时它是否会适应。

用于分别描述这两种范式的一些术语(作者/术语之间的含义存在细微差别)是:

  • 离线/批量/隔离学习
  • 在线/持续/持续/增量/终身学习

此外,一些熟悉的 ML 分支(如迁移学习和多任务学习)与持续学习有很多交集。


相关q: