OpenAI 的健身房环境中的最新成果是什么?是否有指向描述它们以及如何计算这些 SOTA 结果的论文/文章的链接?
OpenAI 的健身房环境中的最新成果是什么?
人工智能
强化学习
参考请求
健身房
最先进的
2021-10-19 04:42:43
1个回答
在健身房 GitHub 存储库中有一个排行榜页面,其中包含指向“解决”不同健身房环境的特定实现的链接,其中“解决”意味着“达到一定的性能水平”,给定一个固定的奖励函数,它是通常以平均(偶发性)回报/回报来衡量。例如,在 CartPole 环境的情况下,当您获得平均奖励为超过连续试验。