人工智能 - 为什么DQN不能用于自动驾驶汽车？ - 吾爱随笔录

为什么DQN不能用于自动驾驶汽车？

人工智能强化学习 dqn 深度学习应用自动驾驶汽车

2021-10-30 06:55:21

为什么DQN不能用于自动驾驶汽车？为什么 DQN 和类似的 RL 算法不能用于自动驾驶汽车？

我好奇的原因是它成功地玩了围棋和其他多态游戏。

1个回答

我不熟悉自动驾驶汽车的来龙去脉，但我想动作空间不是离散的。例如，汽车可能想要决定它需要转弯的角度（而不是向左或向右）。Q-Learning 的更新涉及采取 $\max_aQ(s, a)$ ; 这在理论上对于连续动作空间是可能的，但它本身需要在每个时间步进行一些昂贵的优化才能找到最大值。如果将 RL 应用于自动驾驶汽车，它更有可能是通过一种容易允许连续动作空间的方法，就像本文中详述的方法一样。

我发现了你可能想看的关于自动驾驶深度强化学习的调查。

其它你可能感兴趣的问题

上一篇我的步骤对于正确分类病态大脑是否正确？下一篇如何将二十一点表述为马尔可夫决策过程？