数据挖掘 - Python机器学习/数据科学项目结构 - 吾爱随笔录

我正在寻找有关如何组织 Python 机器学习项目的信息。对于 Python 常用项目，有Cookiecutter和 R ProjectTemplate。

这是我当前的文件夹结构，但我将 Jupyter Notebooks 与实际的 Python 代码混合在一起，看起来不是很清楚。

.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools

我在脚本文件夹中工作，目前在 my_module 下的文件中添加所有函数，但这会导致加载数据时出错（相对/绝对路径）和其他问题。

除了一些 kaggle 竞赛解决方案和一些具有在此类 Notebook 开始时浓缩的所有功能的 Notebook 之外，我找不到关于此主题的适当最佳实践或好的示例。