工作专业人员数据素养的核心组成部分

数据挖掘 大数据 可视化 数据
2022-02-16 10:21:22

我是一名社会科学家,受邀为美国政府的在职专业人士举办 90 分钟的数据素养研讨会。

我一直在努力制定数据素养的简明定义,但已确定它由四个基石组成:1)统计素养,2)编程知识(Python、R 等),3)领域/实质性知识,以及 4)可视化/交流

在我演讲的后半部分,我想提供一个数据素养专业人士提出的 10-12 个关键问题的列表,包括:

  1. 数据来自哪里以及如何收集?数据有多可靠或“嘈杂”(例如测量误差、缺失等)?
  2. 我们从样本中推断出的更大的人口是多少?
  3. 数据的上下文是什么?什么是合适的参考框架或比较点?
  4. 用于解释这些数据的方法的内在权衡(例如偏差与方差)是什么?
  5. 给定模型的预测(例如标准误差、置信区间等)的不确定性水平如何?我如何知道我的推论何时错误?
  6. 这个数据样本是否能帮助我回答我真正感兴趣的问题、谜题或问题?
  7. 你的发现被复制了吗?如果没有,您是否拥有数据和编程脚本,以便其他数据科学家可以尝试复制您的发现?

对此框架或特定问题的任何建议、评论或批评将不胜感激!为专业人士提供有关数据素养的良好资源(视频、在线、书籍)的建议也会有所帮助!

0个回答
没有发现任何回复~