人工智能 - 是否有不基于马尔可夫决策过程的强化学习算法？ - 吾爱随笔录 - 问答

是否有不基于马尔可夫决策过程的强化学习算法？

人工智能强化学习马尔可夫决策过程

2021-11-10 00:46:43

所有 RL 算法都基于 MDP 吗？如果不是，你能举一些不是的例子吗？我在别处看过，但我没有看到它明确说过。

0个回答

没有发现任何回复~

其它你可能感兴趣的问题

上一篇评估使用 Q 学习的策略下一篇self-play 究竟是如何工作的，它与 MCTS 有什么关系？