在阅读有关网络能耗中的 Q-learning 的论文时,我遇到了关于收敛分析的部分。有谁知道收敛分析是什么,为什么强化学习需要收敛分析?
什么是收敛分析,为什么在强化学习中需要它?
人工智能
强化学习
q学习
文件
收敛
2021-10-24 04:32:33
1个回答
收敛分析是关于证明您的策略和/或价值函数收敛到某个期望值,这通常是运算符的不动点或极值。因此从本质上证明了该算法在理论上达到了预期的功能。如果没有收敛,我们不能保证价值函数是准确的,或者策略是好的,所以换句话说,即使在简单的情况下,所提出的 RL 算法也可能完全无法达到其目的。
其它你可能感兴趣的问题