在平铺编码中使用散列时,为什么内存需求减少并且性能损失很小?

人工智能 强化学习 函数逼近 萨顿巴托 计算复杂度 平铺编码
2021-10-26 01:31:31

在《强化学习:简介》(2018 年)一书中,Sutton 和 Barto在第 221 页解释了一种使用散列的平铺编码形式,以减少内存消耗。

我对此有两个问题:

  1. 这种方法如何减少内存消耗?它不只取决于瓷砖的数量(您必须为每个瓷砖存储一个重量)?

  2. 他们说只有“性能损失很小”。在我的理解中,瓦片编码(和粗编码)的含义是,附近的状态有许多共同的瓦片,而远处的状态只有很少的瓦片相同。由于平铺“随机分布在整个状态空间”,情况并非如此。这如何不影响性能?

0个回答
没有发现任何回复~