语境:
我最近采用了版本控制作为我的数据分析工作的一部分(最后我可能会听到你说:请参阅我之前关于 SO 的问题)。这促使我更多地考虑用于项目的存储库和目录结构。
我的典型研究工作涉及一项或多项研究(即我收集的数据),这些研究被写成一份或多份出版物(期刊文章、书籍章节、演示文稿、报告等)。分析和报告通常使用 R、LaTeX、Sweave、文本数据文件等的组合生成。我真的很喜欢能够上传单个独立存储库的想法,该存储库可用于分析数据和复制出版物。
特别是,我一直在思考出版物、研究、数据和公共代码,以及这些实体如何映射到存储库。例如,为每个出版物拥有一个单独的存储库更好,还是将每个出版物作为更大存储库中的单独文件夹更好。我正在对此提出一些想法,但我很想听到其他选择。
问题:
- 人们使用什么策略将研究、出版物和分析映射到存储库?
- 何时应将相关实体(例如,出版物、研究等)拆分为多个存储库?