自学计划帮助(没有本科数学或统计经验)

机器算法验证 数理统计 参考 职业生涯
2022-04-15 01:10:37

这已经在很多地方得到了部分回答,但我在这里再次问。

背景:我在高中时做过微积分、向量和高级函数。然后我获得了社会工作学士学位和社会工作硕士学位,现在我正在寻找博士学位。我认为自己具有统计学知识,比一般的社会工作学生还要好,并且可以使用 SPSS。但是为了进行严格的研究,以社会科学和统计背后的数学理论为基础,我觉得有必要对数学有透彻的理解,这样我才能说出我为什么实际进行分析,为什么我使用某些 alpha 分数,什么我做到了,结果真正意味着什么,而不是仅仅依靠惯例和观众的无知。

到目前为止我收集到的是我应该从线性代数和实际分析的主题开始......也许避免发现统计(尽管它是许多教授和学生的最爱)......但否则我完全迷失了。

最终,我希望能够运行并理解多组验证性因子分析以查看标量不变性,但在未来也可以灵活地进行一些 SEM、IRT、贝叶斯统计和自然语言处理。

所以对于那些想要自学但没有本科数学经验的人......我的轨迹是什么(例如 MOOC、书籍、获得另一个学士学位)?

顺便说一句,我将专注于学习 R - 以提高未来的灵活性。

2个回答

我看到您应该研究的各个领域:

  • 概率基础

在这里您应该了解最常见的连续概率分布(例如正态分布、t 分布)和最常见的离散分布(例如二项式分布和几何分布)。您还应该了解它们是如何相互关联的,例如,如果 n 趋于无穷大,则 t 分布会收敛到正态分布。您还应该了解条件概率和贝叶斯定理等概念,并且应该了解随机过程,例如随机游走。

  • 推论统计基础

您应该了解推理统计和统计测试的基础知识。在统计检验中,p 值和检验功效很重要。

  • 线性代数

线性代数是统计学中最重要的数学概念之一。重要的概念是矩阵的逆和转置。您还应该能够使用矩阵进行计算,例如乘法。

  • 回归和计量经济学

回归分析分为三个不同的领域:横截面回归、面板数据和时间序列分析。您应该遍历所有三个区域。对于从业者来说,时间序列分析可能是这三个领域中最重要的领域,因为它用于预测。

  • 机器学习算法

在对机器学习的不同领域进行了概述之后,您应该了解一些最常见的监督机器学习算法(例如回归和分类)和最常见的无监督机器学习算法(例如聚类、降维和异常检测)

  • 用统计软件编码

R 和 Python 是用于统计计算的最广泛使用的语言。如果我是你,我会选择 R,因为你需要更少的面向对象计算的预知识来使用它。

既然您提到了贝叶斯统计,那么让我向您推荐Sivia 和 Skilling 的《数据分析:贝叶斯教程》。我现在正在自己阅读它,发现它很棒。

这本书确实有助于理解(贝叶斯)概率论的大局。此外,它最终将我在统计课上积累但从未真正理解的所有不同信息联系在一起。它具有恰到好处的数学严谨性和实际应用。我可以继续,试试看!

这本书是这样描述自己的:

统计讲座一直是一代又一代学生困惑和沮丧的根源。本书试图通过对整个数据分析主题阐述一种合乎逻辑且统一的方法来纠正这种情况。

本文旨在作为科学与工程专业的高年级本科生和研究生的辅导指南。在解释了贝叶斯概率论的基本原理之后,通过从基本参数估计到图像处理的各种示例来说明它们的使用。涵盖的其他主题包括可靠性分析、多元优化、最小二乘和最大似然、误差传播、假设检验、最大熵和实验设计。