我们经常听到计算机科学中的项目管理和设计模式,但在统计分析中却很少听到。然而,设计一个有效和持久的统计项目的决定性步骤似乎是让事情井井有条。
我经常提倡使用 R 并在不同的文件夹中统一组织文件(原始数据文件、转换后的数据文件、R 脚本、图形、注释等)。这种方法的主要原因是以后运行分析可能更容易(例如,当您忘记如何碰巧生成给定图时)。
统计项目管理的最佳实践是什么,或者您想根据自己的经验给出哪些建议?当然,这适用于任何统计软件。(每个帖子一个答案,请)
我们经常听到计算机科学中的项目管理和设计模式,但在统计分析中却很少听到。然而,设计一个有效和持久的统计项目的决定性步骤似乎是让事情井井有条。
我经常提倡使用 R 并在不同的文件夹中统一组织文件(原始数据文件、转换后的数据文件、R 脚本、图形、注释等)。这种方法的主要原因是以后运行分析可能更容易(例如,当您忘记如何碰巧生成给定图时)。
统计项目管理的最佳实践是什么,或者您想根据自己的经验给出哪些建议?当然,这适用于任何统计软件。(每个帖子一个答案,请)
我正在编译我在SO(@Shane 建议)、Biostar(以下简称 BS)和这个 SE上找到的一系列快速指南。我尽力确认每个项目的所有权,并选择第一个或高度赞成的答案。我还添加了我自己的东西,并标记了特定于 [R] 环境的项目。
数据管理
编码
分析
版本控制
编辑/报告
作为旁注,Hadley Wickham 提供了R 项目管理的全面概述,包括可重复的示例和统一的数据哲学。
最后,在他的面向 R的统计数据分析工作流程中, Oliver Kirchkamp 提供了一个非常详细的概述,说明为什么采用和遵守特定的工作流程将有助于统计学家相互协作,同时确保数据的完整性和结果的可重复性。它还包括一些关于使用编织和版本控制系统的讨论。Stata 用户可能会发现 J. Scott Long 的The Workflow of Data Analysis Using Stata也很有用。
这并没有具体提供答案,但您可能想查看这些相关的 stackoverflow 问题:
您可能还对John Myles White 最近创建统计项目模板的项目感兴趣。
这与 Shane 的回答重叠,但在我看来,主要有两个方面:
van Belle是成功统计项目规则的来源。