与正常的无模型 RL 任务相比,Deep Successor Representations (DSR)在导航等任务中提供了更好的性能。基本上,DSR 是无模型强化学习和基于模型强化学习的混合体。但最初的工作只使用了 DQN 等基于值的函数深度 RL 方法。
深度后继表示可以与 A3C 算法一起使用吗?
与正常的无模型 RL 任务相比,Deep Successor Representations (DSR)在导航等任务中提供了更好的性能。基本上,DSR 是无模型强化学习和基于模型强化学习的混合体。但最初的工作只使用了 DQN 等基于值的函数深度 RL 方法。
深度后继表示可以与 A3C 算法一起使用吗?