DQN 是否仅限于使用图像帧?

数据挖掘 强化学习 dqn 图片 图片大小
2022-03-10 18:44:31

我对 Deep Q Network 有几个问题。

  1. DQN 是否只接受图像帧作为输入?我从未听过(阅读)不使用图像框架的文书工作。

  2. 如果第一个是否,那么图像帧作为训练的输入是否比任何其他选项更快?例如,在任何 atari 游戏中,帧输入是否可以更快地进行训练,同时具有相同的性能质量?

我知道图像帧也只是数字,就像其他数据一样,但据我所知,即使是低质量的帧也被认为是巨大的。

1个回答

DQN 不仅接受图像帧作为输入。例如,这个用于 CartPole 环境的 DQN 处于一个只有 4 个元素的状态(小车的位置和速度以及杆的角度和速度)。

图像不一定比其他选项更有效。例如,这里是同一 CartPole 环境的另一个 DQN,它使用图像表示并且效率低得多。人们经常使用图像表示的几个原因包括:

  1. 它是任务的唯一可用表示。
  2. 其他模型使用图像表示,您想进行比较。
  3. 您希望向网络传递人类可用的相同信息。

但是,如果这些都不适用,如果您有一个表示可以让您更深入地了解屏幕中元素的位置或轨迹,那么最好使用它而不是原始图像。