过滤 5,000 只股票的算法设计,每只股票都有 4 个月的数据点

计算科学 线性代数 优化 算法 并行计算 库达
2021-12-10 20:49:40

我想过滤 5000 只股票,每只股票都有 4 个月或更长时间的数据(每个 >= 500 个数据点)。我的过滤标准将基于数据点的 8 个计算值。例如,移动平均线、标准差等值。

我选择的工具是 python pandas、numpy 和 CUDA C++;请将此作为可以扩展的默认设置,尤其是在 C++ 方面,我相信我可以扩展线性代数包,但我对它们不太熟悉。

我目前的设计是:

  1. 将数据读入熊猫数据框。
  2. 一次将一只股票传递给 C++ 以计算所有过滤条件值。在这里,我计划使用 CUDA 来加快每个标准值的计算。例如,在 CUDA 内核上并行运行移动平均计算。
  3. 将包含每只股票的过滤条件值的列表传递回 python。
  4. 根据过滤条件值对股票进行排序;当我进行排序时,每个标准的权重都会不同。

我仍在探索,我知道使用不同的工具集会有更好的设计/策略,但是有了这些工具,有没有更好的策略?我可以使用线性代数来进一步加快速度(可能更少的代码)吗?

0个回答
没有发现任何回复~