一起学习概率和统计

机器算法验证 可能性 参考 数理统计
2022-03-25 08:28:15

我之前发布了一个问题,其中提到我对学习机器学习很感兴趣,但我在统计和概率方面的背景非常薄弱。

最近我预览了两本书的页面,似乎很适合我的要求。鉴于我的背景和目标,我只是想知道社区对我可能的选择的看法。

(1)所有统计数据: Larry Wasserman的统计推理简明课程。对我来说看起来不错,但作者没有提供练习问题的答案(更不用说解决方案手册了)。

(2) 一本看似鲜为人知但又简明扼要的书:Michael Baron的计算机科学家概率与统计

对这些书有什么想法或有什么好的替代品吗?强调一下,我是一名 CS 学生,希望快速掌握机器学习的概率和统计数据。我在这一点上只寻找书籍建议而不是网站或视频。

4个回答

我有第 8 版的《现代基本统计》,我看到它有一本奇数问题的配套答案书我还有一个旧版本的 Ott 的《统计方法和数据分析简介》,我发现它非常有用,可以向同事指出我希望看到期刊文章中指定的 GLM 模型。当我学习时,我发现Harraway 的书非常有用,但遗憾的是它再也没有上过其他版本。他是一位非常优秀的作家,有很好的社会科学例子。

第一本书“所有统计数据”是一本很好读的书。我不知道第二本书。但是,我会推荐以下书籍。这本书非常好,可以了解统计和概率方面的情况。

概率与统计的现代导论:理解原因和方式(Springer Texts in Statistics)

作者:FM Dekking、C. Kraaikamp、HP Lopuhaä、LE Meester

我还是喜欢 DeGroot / Schervish。请看一下:

http://www.amazon.com/Probability-Statistics-Edition-Morris-DeGroot/dp/0321500466

它是高度独立的,从基本的集合论开始,涵盖了有关概率的所有标准材料(没有测度论)。之后,推理部分大放异彩,充分解释了充分性、估计、内曼-皮尔森引理、假设检验。他在书的最后介绍了非参数方法和方差分析。DeGroot 的写作节奏不快,而且非常清晰。由于他是贝叶斯统计学家(和 Schervish 一样),因此对贝叶斯主题的讨论比我们通常在同级别的其他书籍中看到的更为详细。第三版最后介绍了仿真,包括 MCMC 工具。

大约一年前(2019 年),我通读了整本书,并将我对第 8-16 章的大部分解决方案放在了 github 上。

如果我错了,请评论并纠正我,但我相信发布的免费pdf是预印本,印刷的书是正式版。我使用了免费的 pdf(并在我的 git repo 中包含了它的副本),但会有一些差异(我认为有些章节的顺序不同,有些问题不同等),所以如果你决定,请记住这一点遵循物理文本。

在我的 git repo 中,我包含了一份免费 pdf 的副本,并有一些指向 Larry 在 CMU 教授的旧课程版本的链接。作业和包含的解决方案非常接近文本,因此在阅读文本时查看它们很有帮助。