联合概率密度函数与随机最优控制和强化学习有什么关系?

人工智能 强化学习 概率分布 控制理论
2021-11-10 22:10:38

我偶然发现了一家公司的工作机会,该公司正在寻找擅长强化学习(应用于金融)的人,他们提供的某些东西引起了我的注意。它是这样的:

我们希望您能够研究(我想是股票的)价格动态及其演变,以提取将用于损失函数(或收益)的最优随机控制的联合 PDF

问题是我理解这些东西的含义以及它们是如何单独使用的(根据我在控制理论和动力系统方面的背景)并且我之前曾使用过拟合联合 PDF 和 Copulas,但我不明白联合 PDF 将如何帮助“损失函数的最优随机控制”?谢谢。

1个回答

提取联合 PDF 仅意味着您创建了一个模型,该模型对组合而不是孤立地模拟多个变量的行为进行建模。

如果这些变量不是独立的并且您的损失函数受到所有这些变量的影响,那么您显然必须学习这个联合 PDF 以最小化您的损失。

所以我不认为这个说法特别神秘。