在 Sutton & Barto(第 2 版)中,第 150 页(pdf 第 172 页)第 7.4 节提到了以下内容:
重要性采样率的期望值为 1(第 5.9 节)并且与估计值不相关。
我们如何证明重要性采样率与估计值不相关?
在 Sutton & Barto(第 2 版)中,第 150 页(pdf 第 172 页)第 7.4 节提到了以下内容:
重要性采样率的期望值为 1(第 5.9 节)并且与估计值不相关。
我们如何证明重要性采样率与估计值不相关?
Sutton 和 Barto在 5.9 节中自行解释。我发布了一些上下文。您正在寻找的等式是 5.13。