我正在尝试为工业中的特定过程开发一种控制方法。我有该过程的时间序列数据,并想开发一个基于注意力机制的预测模型来估计系统的输出。
在开发了预测模型之后,我想设计一个基于深度强化学习的控制器来学习过程优化的策略。但我需要一个模拟环境来测试和训练我的 DRL 算法。
如何根据我的 DRL 注意力机制预测模型创建自定义环境或模拟器?我可以在 OpenAI Gym 的帮助下实现它吗?
如果您帮助我,我将不胜感激。
我正在尝试为工业中的特定过程开发一种控制方法。我有该过程的时间序列数据,并想开发一个基于注意力机制的预测模型来估计系统的输出。
在开发了预测模型之后,我想设计一个基于深度强化学习的控制器来学习过程优化的策略。但我需要一个模拟环境来测试和训练我的 DRL 算法。
如何根据我的 DRL 注意力机制预测模型创建自定义环境或模拟器?我可以在 OpenAI Gym 的帮助下实现它吗?
如果您帮助我,我将不胜感激。