教授抽样分布的策略

机器算法验证 分布 采样 教学
2022-01-18 00:37:18

tl;dr 版本 在本科入门阶段,您采用了哪些成功的策略来教授抽样分布(例如样本均值)?

的背景

9 月,我将使用David Moore的《统计学基本实践》为二年级社会科学(主要是政治学和社会学)学生教授一门统计入门课程。这将是我第五次教授这门课程,我一直遇到的一个问题是学生们对抽样分布的概念感到非常困惑它作为推理的背景进行了介绍,并遵循了对概率的基本介绍,在一些最初的打嗝之后,他们似乎没有遇到麻烦(基本,我的意思是基本——毕竟,这些学生中的许多人都是自选进入特定课程流的,因为他们试图避免任何带有“数学”暗示的东西)。我猜大概有 60% 的人在离开这门课程时没有或几乎没有理解,大约 25% 的人理解了原理,但不理解与其他概念的联系,剩下的 15% 完全理解。

主要问题

学生们似乎遇到的麻烦在于申请。除了说他们只是不明白之外,很难解释确切的问题是什么。从我上学期进行的一项民意调查和考试回复来看,我认为部分困难是混淆了两个相关且相似的发音短语(采样分布和样本分布),所以我没有使用“样本分布”这个短语不再是了,但可以肯定的是,虽然起初令人困惑,但只需稍加努力即可轻松掌握,无论如何它无法解释抽样分布概念的普遍混乱。

(我意识到这可能是和我的教学问题!但是我认为忽略这种不舒服的可能性是合理的,因为有些学生似乎确实明白了,而且总的来说每个人似乎都做得很好......)

我试过的

我不得不与我们系的本科管理员争论,以在计算机实验室中引入强制性课程,认为重复的演示可能会有所帮助(在我开始教授这门课程之前,没有涉及到计算)。虽然我认为这有助于总体理解课程材料,但我认为这对这个特定主题没有帮助。

我的一个想法是根本不教它或不给它太多的权重,这是一些人(例如Andrew Gelman)提倡的立场。我并不觉得这特别令人满意,因为它有教最低公分母的味道,更重要的是拒绝了那些想要通过真正理解重要概念的工作原理(不仅仅是抽样分布! )。另一方面,例如,中位数学生似乎确实掌握了 p 值,因此也许他们无论如何都不需要了解抽样分布。

问题

你采用什么策略来教授抽样分布?我知道有可用的材料和讨论(例如这里这里以及打开PDF 文件的这篇论文),但我只是想知道我是否可以得到一些对人们有用的具体例子(或者我猜什至什么不起作用所以我知道不要尝试!)。我现在的计划,正如我计划九月份的课程一样,是遵循 Gelman 的建议并“不强调”抽样分布。我会教它,但我会向学生保证,这是一种仅供参考的主题,不会出现在考试中(除了作为奖励问题?!)。但是,我真的很想听听人们使用的其他方法。

4个回答

在我看来,抽样分布是统计 101 的关键思想。你不妨跳过这门课程,就像跳过那个问题一样。然而,我熟悉这样一个事实,学生就是不明白,似乎不管你做什么。我有一系列的策略。这些可能会占用大量时间,但我建议跳过/缩写其他主题,以确保他们了解抽样分布。以下是一些提示:

  • 说清楚: 我首先明确提到我们关心的 3 个不同的分布:总体分布、样本分布和抽样分布。我在整个课程中一遍又一遍地说,然后在整个课程中一遍又一遍。每次我说这些术语时,我都强调独特的结尾:样本抽样(是的,学生们确实厌倦了这一点;他们也明白了这个概念。)
  • 使用图片(数字): 我有一套标准的数字,我每次谈论这个时都会使用。它具有清晰描绘的三个分布,并且通常标记。(该图附带的标签在 powerpoint 幻灯片上并包含简短描述,因此它们不会显示在此处,但显然它是:顶部的人口,然后是样本,然后是抽样分布。)
    在此处输入图像描述
  • 给学生活动: 你第一次介绍这个概念时,要么带上一卷镍币(有些四分之一可能会消失),要么带上一堆 6 面骰子。让学生分成小组,生成一组 10 个值并取平均值。然后您可以在板上或使用 Excel 制作直方图。
  • 使用动画(模拟): 我在 R 中编写了一些(可笑的低效)代码来生成数据并在实际中显示它。当您过渡到解释中心极限定理时,这部分特别有用。(注意这些Sys.sleep()陈述,这些停顿让我有时间解释每个阶段发生的事情。)
N = 10
number_of_samples = 1000


iterations  = c(3, 7, number_of_samples)  
breakpoints = seq(10, 91, 3)  
meanVect    = vector()  
x           = seq(10, 90)  
height      = 30/dnorm(50, mean=50, sd=10)  
y           = height*dnorm(x, mean=50, sd=10)  

windows(height=7, width=5)  
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))  

for(i in 1:iterations[3]) {  
  plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")  
  segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")  
  segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")  
  segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")  
  segments(x0=50, y0=0, x1=50, y1=y[41])  
  segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")  
  segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")  
  segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")  
  abline(h=0)  

  if(i==1) {  
    Sys.sleep(2)  
  }  
  sample = rnorm(N, mean=50, sd=10)  
  points(x=sample, y=rep(1,N), col="green", pch="*")  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  xhist1 = hist(sample, breaks=breakpoints, plot=F)  
  hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),  
       ylim=c(0,N), main="", xlab="", ylab="")  
  if(i==iterations[3]) {  
    abline(v=50)  
  }  

  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
  sampleMean = mean(sample)  
  segments(x0=sampleMean, y0=0, x1=sampleMean,   
           y1=max(xhist1$counts)+1, col="red", lwd=3)  

  if(i<=iterations[1]) {  
    Sys.sleep(2)  
  }  
  meanVect = c(meanVect, sampleMean)  
  hist(meanVect, breaks=x, axes=F, col="red", main="",   
       xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))  
  if(i<=iterations[2]) {  
    Sys.sleep(2)  
  }  
}  

Sys.sleep(2)  
xhist2 = hist(meanVect, breaks=x, plot=F)  
xMean  = round(mean(meanVect), digits=3)  
xSD    = round(sd(meanVect), digits=3)  
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))  
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),   
      col="yellow", lwd=2)  
abline(v=50)  

txt1 = paste("population mean = 50     sampling distribution mean = ",  
             xMean, sep="")  
txt2 = paste("SD = 10     10/sqrt(", N,") = 3.162     SE = ", xSD,  
            sep="")  
mtext(txt1, side=1, outer=T)  
mtext(txt2, side=1, line=1.5, outer=T)  
  • 在整个学期中重新实例化这些概念: 每次我们谈论下一个主题时,我都会再次提出抽样分布的想法(尽管通常只是非常简短)。最重要的地方是当您教授 ANOVA 时,作为零假设情况,确实存在您从同一总体分布中多次抽样的情况,并且您的组均值实际上是经验抽样分布。(有关此示例,请在此处查看我的答案:标准错误如何工作?。)

我有幸提醒学生抽样分布是基于随机样本的检验统计量分布。我让学生思考会发生什么,抽样过程本身是有偏见的——侧重于极端情况。例如,如果我们的抽样过程总是选择相同的(特殊)子集,“抽样分布”会是什么样子。然后我会考虑如果我们的抽样过程只选择两个特定(特殊)子集(每个子集的概率为 1/2),“抽样分布”会是什么样子。使用样本均值计算这些非常简单(尤其是对于基础人群的“特殊”的特定选择)。

我认为对于一些(显然不是全部)学生来说,这似乎有助于他们理解抽样分布可能与人口分布非常不同的想法。我还使用了 Michael Chernick 提到的中心极限定理示例并取得了一些成功——尤其是对于明显不正常的分布(模拟似乎确实有帮助)。

我从概率的教学开始。我没有深入讨论很多正式的定义和规则(只是时间不够),而是通过模拟来展示概率。蒙蒂霍尔问题是一个很好的例子,我通过模拟(然后跟进逻辑)表明,切换策略提供了更高的获胜概率。我指出,通过模拟,我们能够多次玩游戏(没有风险或回报)来评估策略,这让我们可以选择更好的策略(如果我们曾经处于那种情况下)。选择更好的策略并不能保证获胜,但它给了我们更好的机会并有助于在策略之间进行选择。然后我指出,这将如何适用于课程的其余部分,它将帮助我们选择有随机成分的策略,

然后,当我介绍抽样分布时,我再次从模拟开始,并说我们想制定策略。就像蒙蒂霍尔问题一样,在现实生活中我们只能采集 1 个样本,但我们可以模拟一堆样本来帮助我们制定策略。然后,我展示了来自同一总体(在本例中为已知总体)的许多样本的模拟,并展示了我们从模拟中学到的关系(样本均值的直方图),即样本均值聚集在真实均值周围(均值的均值是均值) ,较大样本的样本分布标准差较小,较大样本的样本分布更正常。我一直在谈论重复模拟的想法来选择策略,就像现在将蒙蒂霍尔问题应用于样本手段而不是游戏节目的想法一样。然后我展示了官方规则,并说除了模拟之外,它们可以在数学上得到证明,但我不会将证明强加给整个班级。我提议,如果他们真的想看数学证明,他们可以到办公时间来,我会向他们展示数学(入门课程中还没有人接受我的研究)。

然后当我们开始推理时,我说我们将只能在现实世界中抽取 1 个样本,就像我们只能(最多)玩 1 次游戏一样,但我们可以使用从模拟中学到的策略许多样本来开发一种策略(z 检验、t 检验或 CI 公式),该策略将为我们提供选择的属性(正确的机会)。就像游戏一样,在开始之前我们不知道我们的最终结论是否正确(通常我们之后仍然不知道),但我们确实从模拟和抽样分布中知道长期概率使用的是什么那个策略。

是不是100%的学生都理解透彻了?不,但我认为他们中的更多人明白我们可以使用模拟和数学规则(他们很高兴他们不必看,只需相信书/讲师)来选择具有所需的属性。

对您而言,这是一个非常重要且经过深思熟虑的问题。我确实认为采样分布的概念对于理解推理来说是不同的,绝对应该教授。

我教过许多统计入门课程,尤其是生物统计学。我教授抽样分布的概念,并有一些我认为很好的方法,但并没有很好的反馈来确定我使用它们的成功程度。无论如何,这就是我所做的。

首先,我尝试给出一个简单的定义。抽样分布是在多次重复抽样过程时检验统计量的分布。这取决于假设数据是从中生成的人口分布。

尽管我认为这是我所能给出的最简单的定义,但我意识到这不是很简单,并且在大多数情况下不会立即理解这个概念。因此,接下来用一个基本示例来加强定义中所说的内容。

我将使用的示例是一个大小为 n 的样本,该样本独立且同分布为具有均值 μ 和方差 σ的正态分布,然后将样本均值用作均值的点估计或用于形成检验统计量因为均值具有正态的采样分布,均值 μ 和方差 σ /n。22

然后我会用一个重要的应用来跟进,中心极限定理。用最简单的术语来说,中心极限定理说,对于许多非正态分布,当样本量 n 很大时,样本均值的抽样分布将接近正态分布。为了说明这一点,采用均匀分布(双峰分布也很好看),并显示样本大小为 3、4、5、10 和 100 的平均值的采样分布是什么样的。学生可以看到如何分布的形状从对于小 n 看起来完全不正常的东西变为对于大 n 看起来非常像正态分布的东西。

为了让学生相信这些采样分布确实具有这些形状,让学生进行模拟,生成许多不同大小的样本并计算样本均值。然后让他们为这些均值估计生成直方图。我还建议应用一个物理演示来展示它是如何使用梅花板工作的。在执行此操作时,您指出设备如何生成独立伯努利试验之和的样本,其中每个级别向左或向右的概率等于 1/2。底部的结果堆栈表示此采样分布(二项式)的直方图,在大量球落在梅花形底部后,可以看到其形状看起来近似正常,