在分析工作流程中集成以多种语言编码的工具的标准方法

数据挖掘 方法
2022-03-12 23:42:37

我试图在一个分析工作流程中将来自多种语言(R、python、C 等)的多个包和工具拼接在一起。

有没有标准的方法来做到这一点?最好(但不一定)在 python 中。

1个回答

Luigi是 Spotify 的一个开源 python 包,它完全符合您的描述:

Luigi 是一个 Python(2.7、3.3、3.4、3.5)包,可帮助您构建复杂的批处理作业管道。它处理依赖关系解析、工作流管理、可视化、处理故障、命令行集成等等。

它的理念类似于 GNU Make,让您定义任务及其依赖关系。

还有另一个 python 解决方案Apache Airflow(最初来自 Airbnb):

Airflow 是一个以编程方式创作、安排和监控工作流程的平台。使用气流将工作流创作为任务的有向无环图 (DAG)。气流调度程序在遵循指定依赖关系的同时在一组工作人员上执行您的任务。

您可以在此处找到完整的比较表