数据挖掘 - 用于深度强化学习的自定义模拟器 - 吾爱随笔录

我正在尝试为工业中的特定过程开发一种控制方法。我有该过程的时间序列数据，并想开发一个基于注意力机制的预测模型来估计系统的输出。

在开发了预测模型之后，我想设计一个基于深度强化学习的控制器来学习过程优化的策略。但我需要一个模拟环境来测试和训练我的 DRL 算法。

如何根据我的 DRL 注意力机制预测模型创建自定义环境或模拟器？我可以在 OpenAI Gym 的帮助下实现它吗？

如果您帮助我，我将不胜感激。