强化学习在数据效率方面的最新进展是什么?

人工智能 强化学习 参考请求 算法请求 最先进的 样本效率
2021-10-31 04:41:03

换句话说,哪种现有的强化方法用最少的情节学习?我想到了R-Max,但它已经很老了,我想知道现在是否有更好的东西。

2个回答

有一个非常有趣的学习代理。他们称之为神经情节控制。这是论文的链接:https ://arxiv.org/abs/1703.01988 。他们的实验表明,与之前提出的代理相比,NEC 与环境的交互需要少一个数量级。

真的没有一种特定的方法可以让任何 RL 代理的学习速度更快。相反,有一长串方法已经证明可以提高学习速度,而且它们有时可以很好地相互配合。

一些例子:

  1. 选项
  2. 真正的在线方法
  3. 异步方法

这些是我能想到的最有影响力和最有前途的方法,但技术列表不限于这 3 个。