机器学习领域的当前趋势和工具能否复制金融市场的复杂性?如果是,那么该域中可用的工具是什么。
问:我正在尝试建立一个模型来推断股票市场的结果,使用该概念来创建关于入伍公司的图表。任何人都可以建议我这样做吗?
机器学习领域的当前趋势和工具能否复制金融市场的复杂性?如果是,那么该域中可用的工具是什么。
问:我正在尝试建立一个模型来推断股票市场的结果,使用该概念来创建关于入伍公司的图表。任何人都可以建议我这样做吗?
一方面,答案是否定的。你不能在人工智能程序中加入所有必要的细节来正确预测金融市场,至少目前不是。特定事件是过去许多行动和事件的结果。一切都像一条链子。
您可能听说过蝴蝶效应。它只是说小事可以产生非常大的影响。就像蝴蝶扇动翅膀引向飓风。你可以在这里阅读更多关于它的信息。
现在回到你的问题。相信你对金融体系和股票有些熟悉。闭上你的眼睛,试着想象所有正在被输入机器的数据。除此之外,还有许多直接导致金融市场变化的决策。就像政府制定的与公司有关的进出口交易的政策,主要员工(如首席执行官,创始人)的死亡以及其他许多事情。除此之外,还有无数的事情间接影响了市场。我想让你考虑一下。现在考虑对现有的所有股票执行此操作。甚至一个股票的价值都以一种或另一种方式依赖于其他人。
考虑到所有这些因素,以其他方式来看,这一数据量对于当代计算机来说是不可能处理的。不过,你可能会对即将到来的量子计算机产生影响。现在你可以做的是尝试建立一个深度网络(使用强化学习)来预测一些股票
的行为和方向。例如,它是向上还是向下,或者试图在图表上保持一条恒定的线。特征
选择
始终是机器学习算法成功的重要关键。与股票市场相关的人工智能程序面临的另一个问题是,经济学本身就是一个新兴的科学领域。它不像物理、化学或生物学那样成熟。因此,找出并决定特征的选择是另一项艰巨的工作。
我在网上找到了这篇论文。还没有看,但是,我相信这可能会帮助你一点。
审查问题
此发布的问题中包含多个问题。(其中一个句子以句点结尾,但它显然是一个问题。)假设“复制”这个词可以用“模型”或“模拟”代替,所有的都是很好的问题并且很容易回答。(因为金融世界是混乱的,任何有意义的复制都可能需要地球和地球上的每个人和一切的量子级复制。)
在我们所做的研究中一直在进行这种建模、分析和结果可视化。已经按照这些思路向保险、银行和卫生组织提供了方法和概念证明,并且可以在任何保密协议的约束下在此进行一般性讨论。
重述问题
最好我以我从原始帖子中提供的信息中理解的方式重述问题,以确保我理解提问者的意愿。
请说明我的重述是否扭曲了原始三个问题中包含的任何意图。
由顶点和边组成的图通常表示法人实体之间的关系。应用这种可视化来表示来自历史市场数据矩阵的法律实体之间可能的关系是完全可能的,并且可能对财务分析有很多用途。可以使用 GraphViz、Mathematica、Matlab 或可从 Python、C++、Java、LISP、JavaScript 或其他语言的编程环境中使用的各种库来可视化这样的图形。
顶点
与代表注册为税务实体的法人实体的顶点不同,如在许多显示来自公共记录和购买的汇总公司数据的图表的 Web 服务中,提问者可能设想的图表中的顶点将代表可交易证券。这些顶点的属性可能是。
边缘
边代表代表两种可交易证券的任意两个顶点之间可能存在的金融联系强度。
由于提供可交易证券的公司之间的关系的性质和相关细节以及所有交易代理人的心态是模糊的,因此必须天真地推断关系(没有因果关系的事实知识),也许使用牧师托马斯贝叶斯的概率关系( 1701 – 1761)或其他更复杂的方法(出于法律原因,其中一些无法在此处详述)。
必须创建关系模型(可能不止一个)以利用两个选定顶点之一的交易指标中的可识别特征,并将该特征与两个顶点中另一个的相同或另一个特征匹配。相关性必须是统计的,并且设计成能够抵抗与两种可交易证券相关的两个法人实体之间关系之外的影响。
朴素贝叶斯分类、其他统计方法、FFT 或神经网络可用于帮助实现功能相关值。在循环中对数据进行窗口化对于实现对历史数据时域中间隔稀疏的单个事件的敏感性是必要的。
为了尝试猜测因果关系,您将需要应用不同的时间变化来查看一个特征是否先于另一个特征以及多少。(如果证券 B 中的事件 A 先于证券 D 中的事件 C,并且这种模式在几个月或几年的范围内重复,那么事件 C 由事件 A 引起的概率大于零。
创建一组潜在的数学模型的科学(也许是艺术)是关于各种公司和交易关系可能如何影响任何两种证券之间的历史交易指标的,这是这种建议的最佳方法的第一个障碍。
使用各种已知的方法,对于每个提出的模型,关系的单维或多维强度的概率分布可以从两个实体的历史数据中计算出来,在这两个实体之间进行了许多顶点间分析之一。发生。
然后,这些分布的统计数据将是两个顶点之间显示的边的属性。为了更直观的可用性,需要通过点击向下钻取每个边缘以及在边缘连接的两个可交易证券之间尝试的每个模型来获得以下属性。
使计算时间实用的措施
为了完成上述,理想情况下,每个顶点将与每个顶点进行比较,对于每个模型,迭代模型的时间参数以确定涉及时间延迟的关系。
如果要考虑一百个可交易对象,十个概率关系模型,一千个必须尝试收敛的时间排列,以便在每个模型和历史数据之间进行良好拟合,一百次迭代以收敛每个时间窗口,一个一万个时间观察,一万个窗口覆盖整个历史数据范围,以及每个拟合测试的一千个循环,主要计算将是 100 x 99 x 10 x 1000 x 100 x 1000 x 10,000 x 1000 = 99 x 10 ^18 个 CPU 周期。
(数字 99 来自这样一个事实,即在没有某种置换消除方案的情况下,必须将 100 个顶点中的每一个的历史与其他 99 个顶点的历史进行比较。)
可以一起应用几种方法来减少这组扩展排列,以允许在纽约或香港市场收盘后和时区相关黎明前完成批处理。
预言
一旦生成模型并发挥作用,并且可以验证一些可视化构造,那么关系模型就可以用于在可能的事件发生之前对其进行预测。对某些人来说,这可能看起来像是科幻小说,但我们一直在预测物理、社会和经济事件。
就与市场相关的盈利能力而言,如果将此类预测工具分发给其他 11 位交易者,则使用该工具产生利润的能力几乎会立即下降到货币价值的十二分之一。
事实上,这大概就是今天市场的状态。只有那些拥有自动化工具的人可能是赢家,他们从没有工具的人那里筹集资金。
人工智能研究视角
尽管上面描述的方式看起来不像 AI,但通常被视为智能代理并在部署、改进和调整后表现出智能行为的东西,在进入实施细节时看起来就像直接的软件工程。
此外,如果将与用于匹配两个可交易历史中的特征的模型接口的方法通用化,以便可以随意添加或修改任意模型而不会损害作业执行的有效性,则可以构建某种类比遗传算法来搜索表现出更高相关性的模型,从而逐步增强预测能力。
元建模
在开发的这一点上,模型开发仍然很大程度上取决于研究人员。然而,一旦开发了可能采用桥接和外观设计模式的模型接口,就可以将两个可交易对象之间的历史特征相关性概念概括为具有一组变异操作的模型,并开发采用自动化实验的并发流程无需程序员干预即可开发新模型的测试夹具。
尽管出于法律原因,此处无法详细说明此类元模型的细节,但在具有实际可交易历史数据的真实场景中实施和部署上述方法后获得一些经验后,元模型设计选项自然会变得显而易见。
使用现成的代码、库和框架
显然,这种类型的开发具有可观的货币价值,因此任何人都不太可能发布(甚至出售)特定于该领域的代码。然而,使用超级计算平台、基本分析算法(如 FFT 函数)以及具有相关系数例程、朴素贝叶斯能力和收敛检测支持的统计数据包肯定会有助于减少实现和测试这种方法或其他类似方法所需的开发工作量.
你实际上可以建立一个统计模型(不完全和人工智能)来预测股市趋势。但是预测的准确性会很差。
您的模型的准确性取决于以下几点。
注意:这无论如何都不是您问题的正确答案。我只是想说,这个宇宙中的任何事物都可以建模,因为你知道影响它的所有变量以及它们如何相互作用。