推荐哪本书同时开始使用 R 学习统计学?

机器算法验证 r 参考
2022-01-15 07:59:26

使用 R 学习统计学的书籍

我要找的书到底是什么。

我正在寻找的是一本教你统计数据的书,同时使用 R 给你实践经验,从而帮助你一起学习 R。我在亚马逊上看到过很多尝试这样做的书籍,但没有使用 R。例如 Minitab 和 SAS。

R书和统计计算是一种选择吗?-仍然没有回答

R Book and Statistical Computing: An Introduction to Data Analysis using S-Plus似乎可行,但这里的读者意见会有所帮助和欢迎。

这本书与统计学课程有什么关系?

为了更准确地了解我正在寻找的内容,请考虑这两个课程学习结果,这些课程来自大学数学系的统计数据,我目前是一名学生:

Intermediate Statistics and Probability & Statistics,也就是说,我正在看一本书中的普通统计课程,而不是仅仅让你学习和使用 R 的纸板和纸。这也意味着我正在寻找一本假设我想从一开始就学习统计学的书。

这本书也适合研究人员。

我也是一名软件工程师研究员,但我想目前的情况是,您发现有大量数据并想学习统计数据以继续编写代码以实现自动化,这几乎适用于许多其他领域。

这意味着我对学习每条曲线的每一个属性的每一个细节不感兴趣,但我更关心的是让我的研究领域的数据有意义,尽管我不介意这本书是否想深入探讨.

作为最后一个动机,我发现自己在不同类型的社区阅读科学论文,这些论文声称基于统计推断的结果,而如果统计假设/约束是否被违反,则没有可读的证据。

与统计无关的 AR 书并不能确保我不会跟进这种做法,这也是为什么我决定寻找一本类似于使用 R 的统计课程的书,而不是玩概述书。

交叉验证中的相关问题。

这个问题的答案和反馈。

@朱丽叶

推荐的书很少我已经遇到过,但不幸的是,这是一个不适合我的例子:

使用 R 的介绍性统计使用 R 进行介绍性统计统计:使用 R 的介绍是我已经在亚马逊上看过的几本书,但它们是关于统计概述或做出需要先前统计知识的假设的书籍。概述书的问题主要在于没有引起对假设、约束的注意,并没有提供足够的解释来使信息变得有意义。

如果您认为没有一本书也可以满足这种需求,或者认为 R 书或统计计算:使用 S-Plus 的数据分析简介可以满足这种需求,我也会很感激这种类型的答案。

@克里斯托弗亚丁

使用 R 的概率和统计简介似乎是最接近的,但仍然与我所寻找的内容大致相同。

我期待的是一本书,例如David S. Moore, The Basics of Statistics,因为:

  • 它涵盖了所有统计主题。
  • 它使用 miniTab 和其他两个工具来对刚刚解释的方法进行动手学习。
  • 它非常强调假设和约束。这对于没有参加过深入的统计学课程并想使用统计学的研究人员来说非常重要。几乎没有概述书籍会涵盖它们,这对研究人员来说是危险的。
    • 你可以在这里看到本书的目录注意重点是统计,工具的使用是为了提高理解,让学生在学习后知道如何使用工具进行统计,以更简单的方式进行。它不是关于工具,而是关于统计数据!

我想要完全相同的东西,但使用 R。

@Gregory Demin

它使用 R 作为教学示例,假设您想学习统计学,最重要的是,它是开源的。不幸的是,不包括 ANOVA 或 ANCOVA,或更高级的科目。

@彼得埃利斯

对涵盖此问题所需内容的教科书提出了很好的建议。

提问者意见中回答问题的书籍。

@Peter Ellis 和 @Gregory Demin。

亚马逊上的 R 书籍合集

亚马逊关于针对不同学生背景的 R 书籍的讨论可以在这里找到。

使用 R 教授统计学的视频讲座

2007 年的 Google Tech Talks 也激发了这个问题,并涵盖了更多关于数据挖掘而不是统计的内容,但在这里一起使用了R。

4个回答

我认为很难回答这个问题的一个原因是 R 是如此强大和灵活,以至于对 R 编程的真正介绍远远超出了统计学介绍中通常需要的内容。使用 MiniTab、JMP 或 SPSS 教授统计学的书籍正在用软件做相对简单的事情,在数据处理、模拟、定制功能等方面几乎没有触及 R 的能力。

话虽如此,我认为 Wilcox 的《社会和行为科学的现代统计:实用介绍》(2012 年)是一本出色的新书。它假设没有统计知识,并带您从头开始一直到大量现代强大的技术;并且假设 R 知识并不比打开它和加载数据集的能力多多少。它也涵盖了许多经典技术,包括 ANOVA(在 OP 中提到)。

我认为这本书相当于同时介绍统计信息和 SPSS 等统计软件包的书籍。但是,它不会教您使用 R 编程 - 仅教您如何使用它进行现代统计分析,重点是解决经典分析的已知问题的强大技术,而这些问题被大多数其他统计教学方法所忽视。

本书从一开始就特别针对经典方法的三个问题是从重尾分布中抽样;偏度;和异方差。

Wilcox 使用 R 是因为“在利用现代统计技术方面,R 显然占主导地位。在分析数据时,它无疑是过去 25 年来最重要的软件开发。而且它是免费的。虽然经典方法存在根本缺陷,不建议完全放弃它们...因此,提供了如何使用 R 应用标准方法的插图。这里特别重要的是,此外,还提供了有关如何使用超过 900 R 应用现代方法的插图为本书编写的函数。”

这本书非常好,以至于我们买了一本工作后,我在家里买了自己的一本。

章节标题如下:

  1. 数据的数字和图形摘要;
  2. 概率和相关概念;
  3. 抽样分布和置信区间;
  4. 假设检验;
  5. 回归和相关;
  6. 引导方法;
  7. 比较两个独立组;
  8. 比较两个依赖组;
  9. 单向方差分析;
  10. 二通和三通设计;
  11. 比较两个以上的依赖组;
  12. 多重比较;
  13. 一些多元方法;
  14. 稳健的回归和关联测量;
  15. 分析分类数据的基本方法;

进一步编辑- 在查看了您正在寻找的 David Moore 示例后,我真的认为 Wilcox 的书满足了需要。

@Julie 的 Verzani 书的帖子对于没有 R 或统计经验的人来说是一个不错的选择。它在 R 和加州大学戴维斯分校政治科学系使用的统计数据上都足够软,而且这些学生既没有编程课,也没有更高水平的数学。他的工作可通过他的 CRAN 包 simpleR 获得
由于您具有计算机科学背景,因此我认为您不需要对 R 进行非常温和的介绍。我假设您对数据结构、范围以及为什么需要调试器有相当的了解。对于 R 非常以计算为中心的观点(甚至比您在本科统计系的统计编程课程中看到的还要多),请查看 Norm Matloff 的R 编程艺术. 为了看看您是否感兴趣,Matloff在他的网站上提供了一个非常粗略的预印本草稿如果你喜欢他的风格,我建议你拿下完成的副本。他是一名 CS 教授,他写这本书的对象更多是 CS 读者而不是统计读者。
G. Jay Kerns(这里经常发帖)还有一本书在线提供,名为Introduction to Probability and Statistics Using R我个人觉得它对介绍 R 的内容很有帮助。
我知道你的问题是针对 CS 专业的,但也请仔细阅读这个话题:你会为非统计学家的科学家推荐什么书?

我发现本书很有用,但它确实假设了一些基本统计术语的知识,例如 p 值、ANOVA 等。

这本书对统计概念本身进行了更温和的介绍......