强化学习中是否需要特征缩放才能使代理成功学习?

数据挖掘 强化学习 特征缩放
2021-10-10 07:30:12

我经常难以决定如何为代理调整我的输入数据。我正在更改我的数据,以便将数百个值更改为 -1 到 1 之间的值,而原本很小的值将更改为相同的比率。但是,我的代理经常不成功。

输入数据的数值范围是否会成为无法学习的原因?

1个回答

我假设当你说

原本很小的值会以相同的比例发生变化

您正在标准化您的功能,以便每个维度都在 [-1,1] 的相同范围内

这是常见的做法,因为它可以帮助许多模型更快地收敛。它不会阻止您的模型概括数据,因此这里有一些其他可能导致您的问题的原因:

  • 您使用的 ML 算法不适合您的任务
  • 数据要么数量不足,要么质量不足(例如噪声数据)
  • 预处理阶段缺少一些步骤,例如降维