人工智能 - 强化学习在数据效率方面的最新进展是什么？ - 吾爱随笔录

人工智能强化学习参考请求算法请求最先进的样本效率

2021-10-31 04:41:03

换句话说，哪种现有的强化方法用最少的情节学习？我想到了R-Max，但它已经很老了，我想知道现在是否有更好的东西。

2个回答

有一个非常有趣的学习代理。他们称之为神经情节控制。这是论文的链接：https ://arxiv.org/abs/1703.01988 。他们的实验表明，与之前提出的代理相比，NEC 与环境的交互需要少一个数量级。

真的没有一种特定的方法可以让任何 RL 代理的学习速度更快。相反，有一长串方法已经证明可以提高学习速度，而且它们有时可以很好地相互配合。

一些例子：

这些是我能想到的最有影响力和最有前途的方法，但技术列表不限于这 3 个。

其它你可能感兴趣的问题