如何使用强化学习执行车道检测?

人工智能 强化学习 应用
2021-10-20 19:42:05

我对强化学习很陌生,我的项目将包括使用 RL 检测车道。

我正在使用 q-learning,我很难思考我的 q 表应该是什么样子,我的意思是 - 什么可以代表一个状态。我的主要想法是为机器提供一个包含道路图片的框架,边缘检测功能正在应用于该框架(并因此获得大量出现在框架中的线条)。并训练机器哪些线是正确的车道线。我已经有一个可以识别车道的确定性函数,它将是教导机器的函数。我已经组织了一些车道参数,例如(车道长度、车道线、车道颜色(白色或黄色更有可能成为车道)、车道直径和车道坡度)。

现在,我唯一的问题是我应该如何构建 Q 表。基本上,什么可以代表一个状态以及我应该奖励哪些通道或决定。

1个回答

我会同意 malioboro 的观点,也许 RL 对于这样的任务来说太过分了。尽管最近随着自动驾驶研究的趋势,几乎可以肯定存在有关变道的论文,但您应该查看它们以获取更多详细信息。

正如在具有基于规则的约束的深度强化学习的车道变更决策中所述,“当状态是离散且有限的时,Q 函数可以很容易地以表格形式表示。但在许多实际应用中,例如,车道变更决策-制作任务时,它们的状态空间很大甚至是连续的,使用Q-learning算法会导致维度灾难。因此,表格Q-learning算法不适用于连续状态空间和连续动作空间的学习问题"

因此,我建议使用图像处理技术或 Deep-Q-Learning。Q-Learning 无法处理变道或车道跟踪等连续性问题。