用于深度强化学习的自定义模拟器

数据挖掘 lstm 强化学习 注意机制
2022-02-24 16:57:55

我正在尝试为工业中的特定过程开发一种控制方法。我有该过程的时间序列数据,并想开发一个基于注意力机制的预测模型来估计系统的输出。

在开发了预测模型之后,我想设计一个基于深度强化学习的控制器来学习过程优化的策略。但我需要一个模拟环境来测试和训练我的 DRL 算法。

如何根据我的 DRL 注意力机制预测模型创建自定义环境或模拟器?我可以在 OpenAI Gym 的帮助下实现它吗?

如果您帮助我,我将不胜感激。

0个回答
没有发现任何回复~