如何消化统计上下文?

机器算法验证 自习 术语 符号
2022-02-27 18:59:03

首先,我想并不是这个有趣的网站的所有活跃成员都是统计学家作为他们的工作。否则,下面提出的问题没有任何意义!我当然尊重他们,但我需要一个更实际而不是概念性的解释。

我从维基百科的一个例子开始定义point process

令 S 为局部紧致第二可数 Hausdorff 空间,并配备其 Borel σ-代数 B(S)。为 S 上的局部有限计数测量集,上的最小 σ-代数,它呈现所有点计数......可测量。NNN

对我来说这没有任何意义。在工程背景下的解释对我来说更容易理解。

评论:大多数时候,由于类似的复杂文本(至少对我而言),我发现维基百科的解释毫无用处。根据我的经验,只有两种统计参考书:a)极其简单b)极其复杂! 读这两本书对我一点好处都没有!

问题:

  • 你有解决这个问题的方法吗?或者类似的经历?

对于那些发现这篇文章有用的人来说,还有一些好处可以检查:咨询统计学家的参考资料,为他们的客户提供从不同角度讨论相关主题的参考资料。

4个回答

如果我可以澄清一下,您的问题似乎是:“如果像维基百科这样的主要资源没有意义,我可以用什么来理解数学?” 请记住,即使是一个已经掌握了一个概念的人,也必须从一段不理解它的时期开始,然后经历一个学习过程,尽管这个过程几乎从不涉及从维基百科中学到很多东西。

我花了很多时间研究维基百科上描述得非常糟糕的东西,我可以向你保证,即使一个人很好地理解了这些概念,也很难理解一个或多个作者/编辑的想法在维基百科上。看到数学和统计概念被一群对概念非常粗略掌握或为了推进另一个领域对基本概念的薄弱掌握的人所破坏的情况并不少见。(我想说的更多,但要做到这一点,很难不对 Wikipedians,尤其是来自某些其他学科的人的努力感到过分悲观。)

更具建设性的是,最好的参考文献通常是由出版商编辑的那些教科书,这些出版商在编辑和出版特定领域的优秀作品方面有着良好的记录。在这种情况下,作者和编辑的学术质量和严谨性在同行中享有盛誉,一系列连续的版本通常表明其他教师和研究人员的接受。

该级别和维基百科之间有许多质量级别。如果印刷版不可用,使用亚马逊的“书内搜索”或谷歌图书可能是最好的选择。

对于其他可通过网络访问的参考资料,您可能会发现针对非专业从业者的评论文章或手册最为有用。NIST 出版的统计手册就是一个例子

您可能需要通过在 Google Scholar 中查找文章来综合自己的理解。例如,您可以查询 ["a point process is a"] 并检查各种文章中提供的定义。或者,像 ["point process" pdf site:edu] 这样的网络搜索会出现讲义、幻灯片和教程。该查询的第一个结果似乎是“点过程简介”。关键思想是,人们应该搜索倾向于出现或可能出现在适当级别的材料中的术语,这些术语将定义和介绍该概念,无论该措辞是否旨在表示参考文献具有一些相关的说明(例如一篇期刊文章可能会以一种有用的方式定义某些东西,即使它不打算作为介绍性文本)。

反对维基百科上的不良编辑是不可能的:对于某些文章,不良编辑的数量超过了可以容忍修复错误的人数。

我明白你来自哪里。在我的心理学领域,有很多资源以肤浅的方式呈现统计数据。这对许多学生来说很好,但这些书籍并没有为阅读更复杂的书籍提供先决条件。

听起来您需要 (a) 更好地了解统计书籍的范围以及不同资源所暗示的必要先决条件。(b) 定义你的学习目标;(c) 确定您当前的知识;(d) 将它们放在一起创造一个学习环境。

A. 培养对统计资源格局的认识

也许这提供了一个粗略的感觉,介绍性统计资源的格局是在严格和数学复杂性的连续统一体上组织起来的。

  • 食谱:一些资源具有食谱风格,展示了如何使用软件并提供有关何时使用以及如何解释统计输出的提示(例如,SPSS Survival Manual)。这些书是为那些有标准化数据分析需求的人服务的,他们没有时间也没有兴趣进行更深入的学习。
  • 统计学的标准介绍:还有大量的统计学入门书籍,其数学严谨程度各不相同。对于某些人来说,唯一的先决条件是您可以执行基本代数。HyperStat提供了一个在线示例。
  • 更复杂的统计学介绍:虽然可以说是连续统一体,但其他统计学介绍在数学上更严谨一些。在我看来,一个很大的区别在于教科书是否假设读者熟悉微积分和线性代数。正如@iterator 所指出的,在线工程统计手册是这种更复杂资源的一个例子。
  • 数理统计:在下一个严格级别是可以归类为数理统计的资源。例如,查看概率与统计虚拟实验室、麻省理工学院数理统计主题的课程笔记,或此处的数理统计视频课程

B. 定义你的学习目标

你想用这些统计知识做什么?数学严谨性有多重要?您是否需要理解可能出现在 Wikipedia 上的复杂数学描述?

C. 确定你当前的知识

对于社会科学专业的许多学生来说,有效地阅读数学复杂的教科书需要学习或更新大量数学知识。但是,如果您具有工程背景,那么我认为进行更多的数学处理应该不是主要问题。

D. 把它们放在一起

一旦你确定了你想学什么、你已经知道什么以及学习新材料所需的先决条件,挑战就是为你找到最好的资源。

  • 该资源是否需要在 Internet 上免费提供,或者您是否愿意购买或借书?
  • 您是否能够从教科书式资源中充分学习,或者您是否想要或需要一个由讲师用语言表达课程提供的材料和结构的课堂环境?
  • 如果你想看一本特定的教科书,你觉得哪本教科书最清晰、最好等等?

一旦您回答了上述问题,您可能会有更适合本网站的具体问题。例如,“我知道 x、y、z,什么是解释 a、b、c 的好教科书?”

只是为了添加迭代器给出的出色答案。有时无需理解该概念即可成功使用它。我在阅读文章时经常遇到未知概念,但在试图弄清楚它们在外部资源中的含义之前,我总是检查如果我假设未知概念只是某事物的新奇名称,是否有可能理解发生了什么我已经知道了。通常,只使用该新概念的一些特定的易于理解的属性,所以我最终理解了文章作者的所作所为,并且我可以决定它是否有用。

以您问题中的示例定义为例,可以对其进行简化,实际上您可以在同一篇维基百科文章中找到简化。例如S=Rd是局部紧致的第二可数豪斯多夫空间,所以如果你只在Rd,这很好且易于理解,只需查找示例S=Rd并忽略其他一切。对于您的特定问题,未知概念可能变得非常简单。

请注意,这种方法并不总是有效。有时你真的需要深入,然后维基百科就像搜索的起点一样好。在这种情况下,没有什么比一本好书更好的了。有时很容易找到,有时很遗憾没有。

我认为问题存在,但你夸大了它。如果您坚持不懈地进行搜索,您会发现非常有用的书籍和其他资源,它们保持在极端技术之间的中间地带(例如,美国统计协会杂志上的大多数文章;大多数文章由 Andrew Gelman、Bradley Efron 撰写,或唐纳德鲁宾)和极其简单的。我自己花了很多时间寻找这些“中间”资源。如果您想查看我的一些建议,您可以在Yellowbrickstats.com上找到其中的一组。我还经常在北卡罗来纳州立大学的 David Garson 的网站上找到有用的信息。