计算科学 - 过滤 5,000 只股票的算法设计，每只股票都有 4 个月的数据点 - 吾爱随笔录

我想过滤 5000 只股票，每只股票都有 4 个月或更长时间的数据（每个 >= 500 个数据点）。我的过滤标准将基于数据点的 8 个计算值。例如，移动平均线、标准差等值。

我选择的工具是 python pandas、numpy 和 CUDA C++；请将此作为可以扩展的默认设置，尤其是在 C++ 方面，我相信我可以扩展线性代数包，但我对它们不太熟悉。

我目前的设计是：

将数据读入熊猫数据框。

一次将一只股票传递给 C++ 以计算所有过滤条件值。在这里，我计划使用 CUDA 来加快每个标准值的计算。例如，在 CUDA 内核上并行运行移动平均计算。

将包含每只股票的过滤条件值的列表传递回 python。

根据过滤条件值对股票进行排序；当我进行排序时，每个标准的权重都会不同。

我仍在探索，我知道使用不同的工具集会有更好的设计/策略，但是有了这些工具，有没有更好的策略？我可以使用线性代数来进一步加快速度（可能更少的代码）吗？