我正在尝试学习和使用强化学习。现在我的数据集中只有 6 个数字特征。我还能使用 RL 吗?换句话说,可以将 RL 用于如此多的功能是否明智?
强化学习需要多少特征?
数据挖掘
机器学习
强化学习
2021-10-08 08:43:47
2个回答
这实际上取决于您拥有多少数据(样本),而不是每个样本具有多少特征。更重要的是,这取决于您计划如何将问题构建为具有状态和行动的环境。
在学习 RL 的基础知识(与具有神经网络等的 Deep RL 相对)时,考虑单个离散状态变量是相对常见的。例如,许多网格世界、迷宫求解器等只是枚举位置。对于实际学习者,该变量实际上是单热编码的,但它仍然是单个变量。
状态特征的数量与 RL 是否适用无关。
假设您已正确地将问题表述为马尔可夫决策过程 (MDP),那么需要考虑的重要事项是:
状态变量是否捕获了有关当前状态的足够数据以使问题具有马尔可夫属性(仅使用当前状态和动作选择就可以预测未来奖励和状态)?
状态变量在用作学习算法的特征之前是否需要进行预处理?
你的状态空间,一旦变成特征,是不是很小,适合用简单的表格方法学习?
如果状态空间不小,简单的变换(例如使用离散平铺)是否会使问题变得简单、可能是线性的,还是复杂的?可以调整简单的问题以使用表格方法或线性逼近器,复杂的问题将需要来自 Deep RL 的方法,例如 DQN 或 A3C。
其它你可能感兴趣的问题