数学家想要与质量统计学位同等的知识

机器算法验证 参考 职业生涯
2022-02-08 23:25:11

我知道人们喜欢关闭重复项,所以我要求参考开始学习统计数据(如这里)。

我拥有数学博士学位,但从未学过统计学。获得一流的 BS 统计学学位的等效知识的最短途径是什么,以及当我达到这一点时如何衡量。

如果书籍清单就足够了(假设我做了练习),那就太棒了。是的,我希望解决问题是学习它的一个隐含部分,但我想尽可能快地跟踪。我不是在寻找一种极其严格的治疗方法,除非那是统计学专业通常学习的一部分。

4个回答

(非常)短篇小说

长话短说,在某种意义上,统计学就像任何其他技术领域一样:没有捷径可走

很长的故事

统计学学士学位课程在美国相对较少,我认为这是事实的一个原因是,很难将学习统计学所需的所有内容都打包到本科课程中。在具有重要通识教育要求的大学中尤其如此。

培养必要的技能(数学、计算和直觉)需要大量的努力和时间。一旦学生掌握了微积分和相当数量的线性代数和矩阵代数,就可以开始在相当不错的“操作”水平上理解统计学。然而,任何应用统计学家都知道,很容易发现自己处于不符合千篇一律或基于食谱的统计方法的领域。真正了解表面之下发生的事情需要作为先决条件数学和当今世界的计算成熟度只有在本科培训的后期才能真正达到。这是真正的统计培训主要从美国的 MS 级别开始的原因之一(印度,他们专门的 ISI 是一个有点不同的故事。对于一些基于加拿大的教育可能会提出类似的论点。我对以欧洲或俄罗斯为基础的本科统计教育,以获得知情意见。)

几乎所有(有趣的)工作都需要硕士水平的教育,而真正有趣的(在我看来)工作基本上需要博士水平的教育。

鉴于您拥有数学博士学位,尽管我们不知道在哪个领域,但这里是我对更接近 MS 级教育的建议。我包括一些括号内的注释来解释这些选择。

  1. D. Huff,如何用统计说谎(非常快速、易于阅读。展示了许多概念性想法和陷阱,特别是在向外行提供统计数据时。)
  2. Mood、Graybill 和 Boes,《统计理论导论》,第 3 版,1974 年。(MS 级理论统计介绍。您将在经典的频率论框架中了解抽样分布、点估计和假设检验。我的意见是,这通常比 Casella & Berger 或 Rice 等现代同行更好,也更先进。)
  3. Seber & Lee,线性回归分析,第 2 版。(阐述线性模型的点估计和假设检验背后的理论,这可能是应用统计中最重要的主题。由于您可能具有良好的线性代数背景,您应该能够立即理解几何上发生的事情, 它提供了很多直觉。还具有与模型选择中的评估问题、偏离假设、预测和线性模型的稳健版本相关的良好信息。)
  4. Hastie、Tibshirani 和 Friedman,Elements of Statistical Learning,第 2 版,2009 年。(这本书比上一本更具应用感,并且广泛涵盖了许多现代机器学习主题。这里的主要贡献是提供了统计解释许多机器学习的想法,特别是在量化此类模型中的不确定性方面得到了回报。这是典型的机器学习书籍中往往没有(der)解决的问题。在此处免费提供。)
  5. A. Agresti,分类数据分析,第 2 版。(很好地介绍了如何在统计框架中处理离散数据。很好的理论和很好的实际例子。在某些方面可能在传统方面。)
  6. Boyd & Vandenberghe,凸优化(许多最流行的现代统计估计和假设检验问题都可以表述为凸优化问题。这也适用于许多机器学习技术,例如支持向量机。具有更广泛的理解和将此类问题识别为凸程序的能力我认为是非常有价值的。在这里可以合法免费获得。)
  7. Efron & Tibshirani,Bootstrap 简介(您至少应该熟悉引导程序和相关技术。对于教科书来说,它是一本快速易读的书。)
  8. J. Liu,科学计算中的蒙特卡洛策略或 P. Glasserman,金融工程中的蒙特卡洛方法(后者听起来非常针对特定的应用领域,但我认为它将提供所有最重要技术的良好概述和实际示例。在过去十年左右的时间里,金融工程应用推动了大量的蒙特卡洛研究.)
  9. E. Tufte,定量信息的视觉显示(良好的数据可视化和呈现被[高度]低估,即使是统计学家。)
  10. J. Tukey,探索性数据分析(标准。老歌,但好歌。有些人可能会说过时了,但仍然值得一看。)

补充

这里还有一些其他书籍,大多是更高级的、理论性的和/或辅助性的,它们很有帮助。

  1. FA Graybill,线性模型的理论与应用(老式的、糟糕的排版,但涵盖了 Seber & Lee 的所有相同领域,等等。我说老式是因为更现代的处理可能倾向于使用 SVD 来统一和简化许多技术和证明。)
  2. FA Graybill,在统计中的应用矩阵(上面的配套文本。大量好的矩阵代数结果对这里的统计很有用。很好的桌面参考。)
  3. Devroye、Gyorfi 和 Lugosi,模式识别的概率论(关于量化分类问题的性能的严谨和理论文本。)
  4. Brockwell & Davis,时间序列:理论和方法(经典的时间序列分析。理论处理。对于更多应用,Box、Jenkins & Reinsel 或 Ruey Tsay 的文本都不错。)
  5. Motwani 和 Raghavan,随机算法(计算算法的概率方法和分析。)
  6. D. Williams,概率和 Martingales和/或 R. Durrett,概率:理论和示例(如果你看过测度论,比如说,在 DL Cohn 的水平上,但可能不是概率论。如果你已经了解测度论,两者都有助于快速上手。)
  7. F. Harrell,回归建模策略(不如统计学习要素[ESL] 好,但有不同且有趣的内容。涵盖了比 ESL 更多的“传统”应用统计主题,因此当然值得了解。)

更高级(博士级)的文本

  1. Lehmann 和 Casella,点估计理论(点估计的博士级处理。这本书的部分挑战是阅读它并弄清楚什么是错字,什么不是。当你看到自己快速识别它们时,你就会知道你理解了。有很多练习这种类型的,特别是如果你深入研究问题。)

  2. Lehmann 和 Romano,检验统计假设(假设检验的博士级处理。没有上面的 TPE 那么多错别字。)

  3. A. van der Vaart,渐近统计(一本关于统计渐近理论的漂亮书,对应用领域有很好的提示。虽然不是一本应用书。我唯一的小问题是使用了一些相当奇怪的符号,而且细节有时会被掩盖。)

我不能代表更严格的学校,但我正在加州大学戴维斯分校攻读一般统计学士学位(我校最严格的),并且相当依赖严格和推导。数学博士学位会很有帮助,因为您将拥有非常强大的实分析​​和线性代数背景——统计学方面的有用技能。我的统计课程有大约 50% 的课程用于支持基础知识(线性代数、实分析、微积分、概率、估计),另外 50% 用于依赖基础知识的专业主题(非参数、计算、ANOVA/回归、时间序列、贝叶斯分析)。
一旦你掌握了基础知识,跳到细节通常不会太难。我班上的大多数人都在证明和实际分析方面遇到困难,并且很容易掌握统计概念,因此来自数学背景肯定会有所帮助。话虽如此,以下两篇文章很好地涵盖了统计学中涵盖的许多主题。顺便说一句,两者都在您提供的链接中被推荐,所以我不会说您的问题和您链接的问题必然是不相关的。

统计的数学方法, Harald Cramer

所有统计数据:统计推理简明课程,拉里·瓦瑟曼(Larry Wasserman)

英国皇家统计学会提供统计学研究生文凭,相当于良好的学士学位水平。可以从他们的网站获得教学大纲、阅读清单和过去的论文。我知道数学家用它来加快统计速度。参加考试(正式考试,或在您自己的学习中)可能是衡量您在场时间的有用方法。

我会去顶级统计学校的课程网站,写下他们在本科课程中使用的书籍,看看哪些在亚马逊上评价很高,然后在你的公共/大学图书馆订购。

一些需要考虑的学校:

用各种讲座视频网站(如 MIT OCW 和 videolectures.net)补充文本。

加州理工学院没有统计学本科学位,但是按照他们本科统计学课程的课程,你不会出错。