所有统计学家都需要知道哪些核心主题?

机器算法验证 回归 机器学习 数理统计 方差分析 描述性统计
2022-04-05 18:44:15

我想知道哪些主题被认为是统计学家的“核心知识”。请记住,我对统计知之甚少。

在我的大学,我听到统计学专业的学生讨论诸如:时间序列分析描述性统计非参数统计方差分析回归分析统计学习等主题。假设这些是不同的课程,我很好奇这些主题会被考虑一般统计学家的“核心”?

在有人将其标记为重复之前,我已经阅读了很多类似的主题。例如:

如果有统计学家认证考试,课程大纲会是什么?

数学家想要与质量统计学位同等的知识

但是,我发现这些都没有真正具体回答我的问题。我不想参考。我对每个统计学家都应该知道的特定主题列表(如果存在的话)感兴趣,并简要描述了该主题的实际含义。

也许举个例子:我是一名数学和理论物理专业的学生。在我看来,无论数学/物理专业的学生最终会选择哪个专业领域,他们都应该知道一些核心主题。例如,可以列出以下大多数数学学位的标准主题:

  1. 集合论
  2. 范畴论
  3. 点集拓扑
  4. 实分析(微积分、测度论、泛函分析)
  5. 复杂分析
  6. 抽象代数(群、环和场论)
  7. 数论
  8. 微分几何
  9. 偏微分方程
  10. 代数拓扑
  11. 代数几何
  12. ETC

无论学生是否参加过该领域的完整课程,大多数数学学生都应该至少了解这些“核心”领域的基础知识。对于物理学,人们可以提出一个类似的清单。

我的问题是:

有人能想出一个类似的列表来总结统计学家应该知道的基本主题吗?如果是这样,请给出列表中每个主题的基本描述(即使只是一两句话)。

我知道这样的列表从来都不是总结某个领域核心知识的完美(甚至是好的)方式。尽管如此,我还是有兴趣大致了解统计学家研究过哪些主题。

4个回答

我同意@Bayequentist,但会更进一步。

“统计学家”是一个比拥有统计学博士学位的人更广泛的术语。我的博士学位是心理测量学,但我作为统计学家已经工作了 20 多年。(与统计学家交谈时,我称自己为数据分析师)。

我知道的理论比很多人都少(可能比这个网站上几乎所有的常规回答者都要少),但我在数据方面有很多实践经验。

因此,例如,我希望任何称为统计学家的人都了解各种回归。但是他们呢?需要我们都能够证明各种定理吗?我不这么认为。需要我们都能够处理混乱的数据集并弄清楚如何对其建模(并且知道如何与物质专家互动)吗?我不这么认为。

(我可以做第二个,但不能做第一个)。

统计学家是一组极其多样化的专业人士/研究人员,因此他们所有人都应该知道的核心主题集实际上非常少。如果您访问美国的统计研究生课程网站,您会看到常见的核心主题如下:概率论;统计推断理论;(广义)线性模型理论;和基本的计算机编程技能。

应用统计学家应该知道

  • 内外条件概率;产生大量误解的根源,也阻碍了对贝叶斯范式的更多使用α
  • 实验设计、偏差来源和可变性
  • 测量特性以及如何优化它们
  • 如何将主题知识转化为模型规范
  • 哪些建模假设最重要,应该优先考虑哪种类型的模型灵活性(例如,在许多情况下,非线性比非可加性更具破坏性)
  • 如何指定和解释回归模型的细节(至少达到非线性交互项的规范)
  • 模型不确定性以及它如何损害推理,并理解尝试多个模型会破坏推理
  • 了解获得正态性的贝叶斯后验概率比尝试使用数据来决定是否假设正态性更好
  • 如何指定灵活的模型,这样您就不必太担心模型的不确定性
  • 与其学习所有标准统计检验和 ANOVA,不如学习如何通过建模来完成它们(这包括标准的非参数检验,例如 Wilcoxon 和 Kruskal-Wallis)

根据我的经验,统计学家,例如专门从事统计学的数学,具有以下方面的基本理论知识:

  1. 概率论(最重要的)
  2. 数学推理
  3. 数学优化
  4. 回归
  5. 基本编程
  6. 探索性数据研究
  7. 随机方法

请记住,即使从表面上看它不像数学的其他领域那么复杂,但它深深植根于 Mesure 理论,因此它仍然是一门已经专业化的科学的专业化,它是数学。现在,最近,由于技术的进步,计算机知识已成为该领域非常抢手的技能,因此大数据和基础数据科学方面的知识已成为上面列表中的第 8 项。

每个具有严格理论知识基础的统计学学位都将包含上面列表中的每个元素。