扩展数据科学/工程团队的最佳实践

数据挖掘 机器学习 深度学习 数据科学模型 管理
2022-02-17 00:18:15

我正在尝试寻找扩展数据科学团队的最佳实践,即找到一种有效的工作流程/方法来划分软件工程师和研究同一产品的研究人员之间的工作。

我将解释:SE 和研究人员都需要其他人产生的输出,但他们不一定有相同的约束。
- 对于 SE 来说重要的是:代码可维护性、测试、CI/CD、重构代码库以提高开发速度,在存储库中尽可能少的分支
- 对于研究人员来说重要的是:实验速度、实验管理、日志实验、模型管理和版本控制、用于实验的多个 Git 分支

当在同一个 Git 存储库上工作时,我们如何在两者之间进行协调,以同时满足利益相关者并尽可能提高工作效率?

例如,研究人员可能对将他们的实验脚本进行重大重构以将代码分解为更小的代码位的程序包感到不满,或者可能因必须确保他们的代码不会破坏现有的 CI 测试而感到沮丧。

当两个利益相关者在同一个团队/产品中工作时,你能想出一些有趣的模式(或指向有趣的资源、书籍、博客等)来帮助使流程更顺畅吗?非常感谢。

0个回答
没有发现任何回复~