OpenAI 的 Universe 使用 RL 算法。我也知道 Q-learning 已经被用来解决一些游戏。
还有其他解决游戏的机器学习方法吗?例如,我们可以使用遗传算法来开发解决游戏的代理吗?
OpenAI 的 Universe 使用 RL 算法。我也知道 Q-learning 已经被用来解决一些游戏。
还有其他解决游戏的机器学习方法吗?例如,我们可以使用遗传算法来开发解决游戏的代理吗?
是的,进化算法(EA)也可以用来解决/玩游戏。例如,OpenAI 使用进化策略(使用固定长度实值向量和自适应突变率的 EA 子集)来玩 Atari 游戏。在这篇博文中,他们写道
我们发现,进化策略 (ES) 是一种已广为人知的优化技术,它在现代 RL 基准(例如 Atari/MuJoCo)上与标准强化学习 (RL) 技术的性能相媲美,同时克服了 RL 的许多不便。
还有相关论文Evolution Strategies as a Scalable Alternative to Reinforcement Learning (2017) 和代码。