在我看来,抽样分布是统计 101 的关键思想。你不妨跳过这门课程,就像跳过那个问题一样。然而,我很熟悉这样一个事实,学生就是不明白,似乎不管你做什么。我有一系列的策略。这些可能会占用大量时间,但我建议跳过/缩写其他主题,以确保他们了解抽样分布。以下是一些提示:
- 说清楚: 我首先明确提到我们关心的 3 个不同的分布:总体分布、样本分布和抽样分布。我在整个课程中一遍又一遍地说,然后在整个课程中一遍又一遍。每次我说这些术语时,我都强调独特的结尾:样本,抽样。(是的,学生们确实厌倦了这一点;他们也明白了这个概念。)
- 使用图片(数字): 我有一套标准的数字,我每次谈论这个时都会使用。它具有清晰描绘的三个分布,并且通常标记。(该图附带的标签在 powerpoint 幻灯片上并包含简短描述,因此它们不会显示在此处,但显然它是:顶部的人口,然后是样本,然后是抽样分布。)
- 给学生活动: 你第一次介绍这个概念时,要么带上一卷镍币(有些四分之一可能会消失),要么带上一堆 6 面骰子。让学生分成小组,生成一组 10 个值并取平均值。然后您可以在板上或使用 Excel 制作直方图。
- 使用动画(模拟): 我在 R 中编写了一些(可笑的低效)代码来生成数据并在实际中显示它。当您过渡到解释中心极限定理时,这部分特别有用。(注意这些
Sys.sleep()
陈述,这些停顿让我有时间解释每个阶段发生的事情。)
N = 10
number_of_samples = 1000
iterations = c(3, 7, number_of_samples)
breakpoints = seq(10, 91, 3)
meanVect = vector()
x = seq(10, 90)
height = 30/dnorm(50, mean=50, sd=10)
y = height*dnorm(x, mean=50, sd=10)
windows(height=7, width=5)
par(mfrow=c(3,1), omi=c(0.5,0,0,0), mai=c(0.1, 0.1, 0.2, 0.1))
for(i in 1:iterations[3]) {
plot(x,y, type="l", col="blue", axes=F, xlab="", ylab="")
segments(x0=20, y0=0, x1=20, y1=y[11], col="lightgray")
segments(x0=30, y0=0, x1=30, y1=y[21], col="gray")
segments(x0=40, y0=0, x1=40, y1=y[31], col="darkgray")
segments(x0=50, y0=0, x1=50, y1=y[41])
segments(x0=60, y0=0, x1=60, y1=y[51], col="darkgray")
segments(x0=70, y0=0, x1=70, y1=y[61], col="gray")
segments(x0=80, y0=0, x1=80, y1=y[71], col="lightgray")
abline(h=0)
if(i==1) {
Sys.sleep(2)
}
sample = rnorm(N, mean=50, sd=10)
points(x=sample, y=rep(1,N), col="green", pch="*")
if(i<=iterations[1]) {
Sys.sleep(2)
}
xhist1 = hist(sample, breaks=breakpoints, plot=F)
hist(sample, breaks=breakpoints, axes=F, col="green", xlim=c(10,90),
ylim=c(0,N), main="", xlab="", ylab="")
if(i==iterations[3]) {
abline(v=50)
}
if(i<=iterations[2]) {
Sys.sleep(2)
}
sampleMean = mean(sample)
segments(x0=sampleMean, y0=0, x1=sampleMean,
y1=max(xhist1$counts)+1, col="red", lwd=3)
if(i<=iterations[1]) {
Sys.sleep(2)
}
meanVect = c(meanVect, sampleMean)
hist(meanVect, breaks=x, axes=F, col="red", main="",
xlab="", ylab="", ylim=c(0,((N/3)+(0.2*i))))
if(i<=iterations[2]) {
Sys.sleep(2)
}
}
Sys.sleep(2)
xhist2 = hist(meanVect, breaks=x, plot=F)
xMean = round(mean(meanVect), digits=3)
xSD = round(sd(meanVect), digits=3)
histHeight = (max(xhist2$counts)/dnorm(xMean, mean=xMean, sd=xSD))
lines(x=x, y=(histHeight*dnorm(x, mean=xMean, sd=xSD)),
col="yellow", lwd=2)
abline(v=50)
txt1 = paste("population mean = 50 sampling distribution mean = ",
xMean, sep="")
txt2 = paste("SD = 10 10/sqrt(", N,") = 3.162 SE = ", xSD,
sep="")
mtext(txt1, side=1, outer=T)
mtext(txt2, side=1, line=1.5, outer=T)
- 在整个学期中重新实例化这些概念: 每次我们谈论下一个主题时,我都会再次提出抽样分布的想法(尽管通常只是非常简短)。最重要的地方是当您教授 ANOVA 时,作为零假设情况,确实存在您从同一总体分布中多次抽样的情况,并且您的组均值实际上是经验抽样分布。(有关此示例,请在此处查看我的答案:标准错误如何工作?。)