并行 Q 学习

数据挖掘 神经网络 平行线 强化学习 q学习 pybrain
2021-09-24 17:48:50

我正在寻找专注于并行强化学习(特别是 Q 学习)主题的学术论文或其他可靠来源。我最感兴趣的是在进程之间共享 Q-table 的方法(或者如果每个进程都有自己的,则将它们连接/同步在一起)。我也很欣赏链接/提到的来源中使用的方法的简要描述。

我应该提到我使用神经网络(PyBrain)作为近似值。

1个回答

我想你会喜欢以下两篇论文:

可从:http ://arxiv.org/abs/1507.04296

Nair A、Srinivasan P、Blackwell S、Alcicek C、Fearon R、De Maria A 等。深度强化学习的大规模并行方法。arXiv 预印本 arXiv:150704296

可从:http ://arxiv.org/abs/1602.01783

Mnih V, Badia AP, Mirza M, Graves A, Lillicrap TP, Harley T, et al. 深度强化学习的异步方法。arXiv:160201783