什么是实际良好的数据分析过程?

机器算法验证 项目管理
2022-02-08 09:33:22

我想了解或参考大多数统计数据分析师在每个数据分析项目中经历的分析过程。

如果我列一个“清单”,要完成数据分析项目,分析师必须:

  1. 首先收集项目的需求,
  2. 根据之前的这些要求计划/设计他的数据分析
  3. 实际预处理数据,
  4. 执行数据分析和
  5. 根据他的分析结果写报告。

对于这个问题,我对第 2 步的更多细节感兴趣。但我知道这实际上并不明确,因为分析师可能必须根据数据分析输出更改他的计划或设计。有没有关于这个问题的参考?

3个回答

我最喜欢的“计划”或“列表”是 Scott Emerson 的文档组织您的数据分析方法

注意:最后两页在“博士应用考试的一般要求”标题下,但那里给出的建议概括为解决任何分析问题。

我发现The Workflow of Data Analysis Using Stata是一本好书,特别是(但不仅限于)作为 Stata 用户。我发现了很多不同意的地方,但即使这样也有助于澄清我为什么以某种方式做事。

CRISP-DM,由SPSS公司(现属于IBM)创造,是数据挖掘过程的首字母缩写,与“数据分析”相同。SAS 有一个类似的过程,称为SEMMA