教授(非常基础的)统计建模

机器算法验证 参考 造型 教学 例子
2022-04-11 10:29:39

我被要求从统计的角度为“数学建模”课程贡献一些讲座(或部分讲座)。这是针对一群相当混杂的数学本科生:有些人以前可能只看过一门关于概率和统计的课程。

有大量书籍的标题为“数学建模简介”(搜索中的第一个示例),它们通常专注于使用例如微分方程。这些来源通常对我所说的蒙特卡洛模拟有一点意义:向模型添加一些随机性,然后运行模拟。但是,至少在我看过的书中,很少有“数据驱动”的。

  • 我想强调的是,这些书在数学上相当简单,但同时也不能称为“科普”。

我正在寻找的是从一些数据开始的小案例研究,然后讨论各种概率模型,然后拟合这些模型,然后做出预测或推论,进行一些假设检验(嗯,我更喜欢贝叶斯的观点,但这不是我们学生的教学方式)等等。但是,我发现的是:

  • 任何标题中带有“统计建模”的书似乎都太高级了:例如,从广义线性模型开始
  • 我喜欢许多贝叶斯教科书所采用的方法(举个例子,Sivia 和 Skilling),但这些仍然相当复杂(相对而言)。我想我真的很喜欢这种风格的演讲,但它假设的读者更少,而不是成为“大众科学”。
  • 当然,基本的统计教科书有很多例子,但这些往往会激发我正在寻找的东西:例如在引入泊松分布之后,提供了一些数据(实际上可能只是给出的样本平均值),并且一些评论。但似乎缺少的是为什么我们可能会选择泊松分布而不是其他选择,等等。

我喜欢一些我所追求的风格的示例资源。

(我还应该说,我希望逃避实际讲课,而是将一些资源提供给同事......)

2个回答

不是舒尔,这是否值得一个答案或只是一个评论,但我想要这个论坛只提供答案的房间。

  1. 看看这个高尔夫推杆示例,Andrew Gelman 在关于 stan 的网络研讨会上给出的。忘记它的贝叶斯方面。它仅显示了与知情模型相比的标准模型,以及将有关主题的知识(而不是先验数据!)引入模型选择时结果如何改善:https ://youtu.be/T1gYvX5c2sM?t=2844 这应该是值得的注意,无论数学知识如何。

  2. 第二个来源也是 Andrew Gelman 的 youtube 演讲。在他的演讲“数据犯罪”中,他描述了一些已发布但非常有问题的模型。这些示例是“实际发布的,作为数学家可能面临的问题”意义上的“真实世界”。无需大量数学,您就可以从中学到很多东西。一方面,我知道,小型研究不太可能产生显着的结果。在这次谈话之前,我才明白,一项小型研究中的显着结果是如何成为一个更大的问题。从这个例子开始,如果你喜欢的话,听听整个演讲 https://youtu.be/fc1hkFC2c1E?t=735

但似乎缺少的是为什么我们可能会选择泊松分布而不是其他选择

这确实是概率教科书的常见特征——甚至是统计研究工作。似乎有些禁忌。统计学家 AP Dawid (1982, § 4, p. 220) 指出:

概率模型从何而来?从大多数统计学家对这个问题的彻底沉默来判断,这似乎非常尴尬。一般来说,理论家乐于接受他的抽象概率三元组是在醋栗丛中发现的,而应用统计学家的模型“刚刚增长”。(Ω,A,P)

从物理学家(或生物学家等)的角度来看,这是一种遗憾和罪恶,因为它无助于解释事情发生的原因和方式。我什至担心今天有一种相反的趋势:将概率模型本身视为一种解释。例如,我看过一些研究文章指出,经济学中特定现象背后的解释是“运气”——当然这根本不是解释,而只是声明我们不知道原因或机制.

好吧,对不起这个最初的咆哮。看到有人问为什么要使用泊松模型,而不是说“因为泊松”,真是令人欣慰!

回到你的问题。很难找到您要询问的示例类型。您很可能会在物理学家的著作中找到它们;但是他们对概率的使用通常很差,而且数学对于您的目的来说可能太多了。Jaynes 的作品是个例外,因此您可能会在那里找到示例。略读他的概率论:科学的逻辑特别是查看 §§ 6.10–6.11 以获取泊松分布如何从物理推理中出现的示例。

Mosteller & Wallace's Inference in an authorship problem (1963) 是莫斯特勒和华莱士在作者身份问题中的推理,其中使用的每个概率模型都是通过推理来激发的,这是一部绝对出色的作品。真的推荐。也许您可以从中构建数学简化的示例。

如果您在文献中找到任何有用的示例,请回答您自己的问题并与我们分享!

参考

  • AP Dawid (1982):主体间统计模型,G. Koch, F. Spizzichino:概率与统计中的可交换性(北荷兰),第 217--232 页

  • ET Jaynes (2003):概率论:科学的逻辑(剑桥)。看看这个链接这个链接

  • F. Mosteller, DL Wallace (1963): Inference in an authorship problem: A comparison study of contrast methods applicable to the authorship of the有争议的联邦党人 论文,J. Am. 统计。副教授。58 /302,第 275-309 页。也在这个链接上。