我该怎么腐烂εε在 Q 学习中?

人工智能 强化学习 q学习 深度学习
2021-11-04 03:15:29

我该如何腐烂ε在 Q 学习中?

目前,我正在衰减 epsilon,如下所示。我初始化ε为 1,然后,在每一集之后,我将它乘以一些C(随它去0.999),当它达到0.01. 之后,我保持ε成为0.01每时每刻。我认为这有一个可怕的后果。

所以,我需要一个ε衰减算法。我还没有找到关于它的脚本或公式,你能告诉我吗?

1个回答

您描述的方式往往是常见的方法。当然还有其他方法可以做到这一点,例如使用指数衰减,或者只在“成功”插曲后衰减,尽管在后一种情况下,我想你会想从一个较小的开始ε值,然后衰减较大。