我想开始编写一个多任务强化学习模型。为此,我不仅需要一个迷宫或网格世界(或仅基于模型),还需要许多具有不同奖励功能的世界。所以,我想知道是否存在这样的数据集或生成器,还是我需要自己编写所有代码?
是否有任何用于强化学习的网格世界数据集或生成器?
人工智能
强化学习
q学习
基于模型的方法
价值函数
2021-10-20 08:05:19
1个回答
根据您的需求和项目的规模,您最好制作一组自定义环境。不过,如果你不想这样做,你应该看看 OpenAI 的CoinRun 环境。可以在他们的博客文章中找到高级描述。
此环境的“RandomMazes”版本可能对您有用。如果你想让迷宫更小,你可以在 coinrun.cpp 中重新定义 MAX_MAZE_DIFFICULTY。
请注意,尽管级别是程序生成的,但只有在代理拿起单个硬币时才会给予奖励。所以,这可能不像你想要的那样多样化。