看了一些文章,还是搞不懂Dueling DQN和Double DQN的区别?它们之间究竟有什么区别?另外,决斗 DQN 是否需要建立在双 DQN 之上?谢谢!
决斗 DQN 和双 DQN 的区别?
数据挖掘
强化学习
q学习
dqn
深度学习
2021-10-08 06:15:21
1个回答
它们是不同的技术。Double 使用两个网络来避免过度乐观的 q 值。Dueling 使用两个新的流,即价值和优势来分离估算器。然后聚合这两个流。
其它你可能感兴趣的问题