我在 Google 搜索上阅读了有关深度 Q 学习的热门文章:
- https://medium.freecodecamp.org/an-introduction-to-deep-q-learning-lets-play-doom-54d02d8017d8
- https://skymind.ai/wiki/deep-reinforcement-learning
- https://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/
- 维基百科上的 Q-Learning 页面*
然后我注意到他们都使用 CNN 作为逼近器。如果深度学习有比 CNN 更广泛的定义,如果我们不使用 CNN,我们可以在我们的模型上使用“深度 Q-Learning”这个术语吗?还是对这种 Q-Learning 模型有更合适的定义?例如,如果我的模型只使用深度全连接层。
*它没有明确说明 Deep RL 是指 CNN on RL,但它使用 DeepMind(使用 CNN)作为 Deep Q-Learning 的示例