在 @doubled 的 (+1) 卡方检验之后,剩下的问题是机器的 220 次抽签是否足以检测到实际的小偏差。也许奇数的球更重、更轻或更圆,这样它们就更有可能被抽中。也许真正的概率分布是(6,4,6,4,6,4,6,4,6,4,6,4)/60.基于 220 次抽签的卡方检验检测到这种偏向于奇数的概率是多少?
基于此分布,可以模拟m=100000每次抽签 220 次,每次做卡方检验,看看抽到的分数是多少msession 拒绝了抽奖是公平的零假设。这很好地近似了卡方检验检测指定不公平程度的能力。
首先,让我们看一个这样的模拟会话——恰好没有检测到不公平性(P 值 > 5%)。[使用 R.]
# one session
set.seed(411) # for reproducibility
pr = c(6,4,6,4, 6,4,6,4, 6,4,6,4)/60
x = sample(1:12, 220, rep=T, p = pr)
TB = tabulate(x); TB
[1] 23 11 17 20 20 16 19 19 20 17 21 17
chisq.test(TB)$p.val
[1] 0.898677
现在,通过模拟m届会n=220每次抽签,我们发现我们检测到这种不公平程度的机会只有不到 50:50。在模拟运行向量结束时pv
有mP 值,并mean(pv <= 0.05)
给出拒绝的比例。[给出正确计数nbins=12
的tabulate
力参数tabulate
,即使会话缺少一些更高的数字。]
# 100,000 sessions
set.seed(2021)
pr = c(6,4,6,4, 6,4,6,4, 6,4,6,4)/60
m = 10^5; pv = numeric(m)
for(i in 1:m) {
x = sample(1:12, 220, rep=T, p = pr)
TB = tabulate(x, nbins=12)
pv[i] = chisq.test(TB)$p.val
}
mean(pv <= 0.05)
[1] 0.45349
此外,运行程序n=500每次会话抽奖 [未显示] 提供几乎 90% 的功率,并且运行n=650功率略高于 95%。
注意:在这些简单的情况下,没有必要进行模拟来近似卡方检验的功效H0:Fair反对替代向量pr
,使用n画。
5% 临界值c=19.6751拥有P(Q>c|H0)=0.05.而“效果大小”是
λ=n∑(pai−1/12)21/12=8.8.那么确切的功率0.4602使用带度数的卡方分布找到ν=12−1=11和非中心性参数λ.
c = qchisq(.95, 11); c
[1] 19.67514
lam = 220*sum((pr-1/12)^2/(1/12)); lam
[1] 8.8
1 - pchisq(c,11,lam)
[1] 0.4602406
相比之下n=650,我们有λ=26和权力0.9574.
lam = 650*sum((pr-1/12)^2/(1/12)); lam
[1] 26
1 - pchisq(c,11,lam)
[1] 0.9573635
也许请参阅此问答及其参考资料。