我是一个机器学习新手,正在尝试学习 Q-learning。我阅读了几篇文章,了解了大致的要点,但我真正希望看到的是 Python 中 Q 学习算法的一个简单示例,我可以运行和使用它。
它可以解决最简单的游戏,我不是在寻找任何花哨的东西。
我搜索并发现了很多使用该gym框架的示例。这个框架看起来很棒,我以后可能会使用它,但我想要 Q-learning 算法的最简单的版本,不会自动为我做任何事情。我认为这将帮助我更好地了解正在发生的一切。
你知道 Q-learning 的简单 Python 实现吗?