我正在尝试为 Atari Pong 游戏构建 DQN 模型,但我不确定该模型是否正在学习。
我正在使用论文Playing Atari with Deep Reinforcement Learning中描述的架构。我在一个更简单的环境(比如 CartPole)上测试了模型,效果很好,但是我没有看到 Pong 有任何进展,我已经训练了模型 2-3 个小时,它的性能并不比随机行动。
我应该继续等待,否则我的代码可能有问题。在我看到一些积极的结果之前大约需要多少集?
我正在尝试为 Atari Pong 游戏构建 DQN 模型,但我不确定该模型是否正在学习。
我正在使用论文Playing Atari with Deep Reinforcement Learning中描述的架构。我在一个更简单的环境(比如 CartPole)上测试了模型,效果很好,但是我没有看到 Pong 有任何进展,我已经训练了模型 2-3 个小时,它的性能并不比随机行动。
我应该继续等待,否则我的代码可能有问题。在我看到一些积极的结果之前大约需要多少集?