OpenAI 的健身房环境中的最新成果是什么?

人工智能 强化学习 参考请求 健身房 最先进的
2021-10-19 04:42:43

OpenAI 的健身房环境中的最新成果是什么?是否有指向描述它们以及如何计算这些 SOTA 结果的论文/文章的链接?

1个回答

在健身房 GitHub 存储库中有一个排行榜页面,其中包含指向“解决”不同健身房环境的特定实现的链接,其中“解决”意味着“达到一定的性能水平”,给定一个固定的奖励函数,它是通常以平均(偶发性)回报/回报来衡量。例如,在 CartPole 环境的情况下,当您获得平均奖励为195.0超过100连续试验。