我正在寻找专注于并行强化学习(特别是 Q 学习)主题的学术论文或其他可靠来源。我最感兴趣的是在进程之间共享 Q-table 的方法(或者如果每个进程都有自己的,则将它们连接/同步在一起)。我也很欣赏链接/提到的来源中使用的方法的简要描述。
我应该提到我使用神经网络(PyBrain)作为近似值。
我正在寻找专注于并行强化学习(特别是 Q 学习)主题的学术论文或其他可靠来源。我最感兴趣的是在进程之间共享 Q-table 的方法(或者如果每个进程都有自己的,则将它们连接/同步在一起)。我也很欣赏链接/提到的来源中使用的方法的简要描述。
我应该提到我使用神经网络(PyBrain)作为近似值。
我想你会喜欢以下两篇论文:
可从:http ://arxiv.org/abs/1507.04296
Nair A、Srinivasan P、Blackwell S、Alcicek C、Fearon R、De Maria A 等。深度强化学习的大规模并行方法。arXiv 预印本 arXiv:150704296
可从:http ://arxiv.org/abs/1602.01783
Mnih V, Badia AP, Mirza M, Graves A, Lillicrap TP, Harley T, et al. 深度强化学习的异步方法。arXiv:160201783