换句话说,哪种现有的强化方法用最少的情节学习?我想到了R-Max,但它已经很老了,我想知道现在是否有更好的东西。
强化学习在数据效率方面的最新进展是什么?
人工智能
强化学习
参考请求
算法请求
最先进的
样本效率
2021-10-31 04:41:03
其它你可能感兴趣的问题