我正在寻找有关如何组织 Python 机器学习项目的信息。对于 Python 常用项目,有Cookiecutter和 R ProjectTemplate。
这是我当前的文件夹结构,但我将 Jupyter Notebooks 与实际的 Python 代码混合在一起,看起来不是很清楚。
.
├── cache
├── data
├── my_module
├── logs
├── notebooks
├── scripts
├── snippets
└── tools
我在脚本文件夹中工作,目前在 my_module 下的文件中添加所有函数,但这会导致加载数据时出错(相对/绝对路径)和其他问题。
除了一些 kaggle 竞赛解决方案和一些具有在此类 Notebook 开始时浓缩的所有功能的 Notebook 之外,我找不到关于此主题的适当最佳实践或好的示例。