人工智能 - 在 Atari 环境中训练 DQN 需要多长时间？ - 吾爱随笔录

我正在尝试为 Atari Pong 游戏构建 DQN 模型，但我不确定该模型是否正在学习。

我正在使用论文Playing Atari with Deep Reinforcement Learning中描述的架构。我在一个更简单的环境（比如 CartPole）上测试了模型，效果很好，但是我没有看到 Pong 有任何进展，我已经训练了模型 2-3 个小时，它的性能并不比随机行动。

我应该继续等待，否则我的代码可能有问题。在我看到一些积极的结果之前大约需要多少集？