数据挖掘 - Python中q-learning的参考实现 - 吾爱随笔录

我是一个机器学习新手，正在尝试学习 Q-learning。我阅读了几篇文章，了解了大致的要点，但我真正希望看到的是 Python 中 Q 学习算法的一个简单示例，我可以运行和使用它。

它可以解决最简单的游戏，我不是在寻找任何花哨的东西。

我搜索并发现了很多使用该gym框架的示例。这个框架看起来很棒，我以后可能会使用它，但我想要 Q-learning 算法的最简单的版本，不会自动为我做任何事情。我认为这将帮助我更好地了解正在发生的一切。

你知道 Q-learning 的简单 Python 实现吗？