人工智能 - 是否有任何用于强化学习的网格世界数据集或生成器？ - 吾爱随笔录

人工智能强化学习 q学习基于模型的方法价值函数

2021-10-20 08:05:19

我想开始编写一个多任务强化学习模型。为此，我不仅需要一个迷宫或网格世界（或仅基于模型），还需要许多具有不同奖励功能的世界。所以，我想知道是否存在这样的数据集或生成器，还是我需要自己编写所有代码？

1个回答

根据您的需求和项目的规模，您最好制作一组自定义环境。不过，如果你不想这样做，你应该看看 OpenAI 的CoinRun 环境。可以在他们的博客文章中找到高级描述。

此环境的“RandomMazes”版本可能对您有用。如果你想让迷宫更小，你可以在 coinrun.cpp 中重新定义 MAX_MAZE_DIFFICULTY。

请注意，尽管级别是程序生成的，但只有在代理拿起单个硬币时才会给予奖励。所以，这可能不像你想要的那样多样化。

其它你可能感兴趣的问题