我们必须使用 CNN 进行深度 Q 学习吗?

人工智能 强化学习 定义 深度学习
2021-11-09 02:50:18

我在 Google 搜索上阅读了有关深度 Q 学习的热门文章:

然后我注意到他们都使用 CNN 作为逼近器。如果深度学习有比 CNN 更广泛的定义,如果我们不使用 CNN,我们可以在我们的模型上使用“深度 Q-Learning”这个术语吗?还是对这种 Q-Learning 模型有更合适的定义?例如,如果我的模型只使用深度全连接层。

*它没有明确说明 Deep RL 是指 CNN on RL,但它使用 DeepMind(使用 CNN)作为 Deep Q-Learning 的示例

2个回答

不会。DQN 和其他深度强化学习方法适用于全连接层。这是不使用 CNN 的 DQN 实现:github.com/keon/deep-q-learning/blob/master/dqn.py

DeepMind 主要使用 CNN,因为他们使用图像作为输入状态,并且因为他们试图评估他们的方法的性能与人类的性能。在以图像为输入状态的游戏中,人性化的表现很容易衡量,这就是为什么基于 CNN 的方法现在在 RL 中如此迅速地出现的原因。

逼近器可以是任何人工神经网络架构,包括深度全连接网络。