数据挖掘 - 如何在强化学习中为开放环境建模？ - 吾爱随笔录 - 问答

如何在强化学习中为开放环境建模？

数据挖掘机器学习强化学习

2022-02-16 04:34:43

我正在研究强化学习以实现一种时间序列模式分析器，例如市场。

我见过的大多数例子都是基于迷宫环境的。

但在真实的市场环境中，信号会随着时间的推移而不断变化，我无法猜测如何对环境和状态进行建模。

另一个问题是关于买卖模型的。

让我们假设代理在某个时间随机购买 $t$ 并及时出售 $t + \alpha$ .

计算奖励很简单。问题是我如何建模 $Q$ 矩阵以及如何对买入和卖出行为之间的信号进行建模。

你能分享一些类似情况的源代码或指导吗？

0个回答

没有发现任何回复~

其它你可能感兴趣的问题

上一篇ANOVA RBF 内核返回非常差的结果下一篇结构化支持向量机中的特征权重