我对 Deep Q Network 有几个问题。
DQN 是否只接受图像帧作为输入?我从未听过(阅读)不使用图像框架的文书工作。
如果第一个是否,那么图像帧作为训练的输入是否比任何其他选项更快?例如,在任何 atari 游戏中,帧输入是否可以更快地进行训练,同时具有相同的性能质量?
我知道图像帧也只是数字,就像其他数据一样,但据我所知,即使是低质量的帧也被认为是巨大的。
我对 Deep Q Network 有几个问题。
DQN 是否只接受图像帧作为输入?我从未听过(阅读)不使用图像框架的文书工作。
如果第一个是否,那么图像帧作为训练的输入是否比任何其他选项更快?例如,在任何 atari 游戏中,帧输入是否可以更快地进行训练,同时具有相同的性能质量?
我知道图像帧也只是数字,就像其他数据一样,但据我所知,即使是低质量的帧也被认为是巨大的。
DQN 不仅接受图像帧作为输入。例如,这个用于 CartPole 环境的 DQN 处于一个只有 4 个元素的状态(小车的位置和速度以及杆的角度和速度)。
图像不一定比其他选项更有效。例如,这里是同一 CartPole 环境的另一个 DQN,它使用图像表示并且效率低得多。人们经常使用图像表示的几个原因包括:
但是,如果这些都不适用,如果您有一个表示可以让您更深入地了解屏幕中元素的位置或轨迹,那么最好使用它而不是原始图像。