是否有任何用于强化学习的网格世界数据集或生成器?

人工智能 强化学习 q学习 基于模型的方法 价值函数
2021-10-20 08:05:19

我想开始编写一个多任务强化学习模型。为此,我不仅需要一个迷宫或网格世界(或仅基于模型),还需要许多具有不同奖励功能的世界。所以,我想知道是否存在这样的数据集或生成器,还是我需要自己编写所有代码?

1个回答

根据您的需求和项目的规模,您最好制作一组自定义环境。不过,如果你不想这样做,你应该看看 OpenAI 的CoinRun 环境可以在他们的博客文章中找到高级描述。

此环境的“RandomMazes”版本可能对您有用。如果你想让迷宫更小,你可以在 coinrun.cpp 中重新定义 MAX_MAZE_DIFFICULTY。

请注意,尽管级别是程序生成的,但只有在代理拿起单个硬币时才会给予奖励。所以,这可能不像你想要的那样多样化。