抛硬币 n 次的假设检验

机器算法验证 可能性 假设检验 统计学意义 正态分布 推理
2022-02-28 18:15:59

你抛硬币 n 次,你观察到 60% 的次数是正面。

n 需要多大才能达到 95% 的置信度,即它不是一枚公平的硬币?

=======

尝试:基本上使用二项分布,但我不知道如何将 60% 的数字考虑到我的计算中。

μ+/ZαS(n),so I have, 0.6(n)0.60.60.4=Z0.05=1.96,所以 = 1.6n

2个回答

您希望足够大,使得置信区间为其中是正面的数量,不包括np^±1.96p^(1p^)n,Xp^=X/n,0.5.

粗略地说,标准误差为 ,误差范围约为并且您希望边际误差小于因此左右就足够了。我在下面展示了的示例。.6(.4)/n2.6(.4)/n0.98/n.0.1,n=96n=100

n = 100;  x = 60;  z = qnorm(c(.025,.975))
CI = .6 + z*sqrt(.24/100);  CI
[1] 0.5039818 0.6960182

由于 Agresti 和 Coull 的一种优越的 CI 使用点估计并且端点在这个间隔也只是错过了覆盖p~=(x+2)/(n+4)=62/104=0.5962p~±1.96p~(1p~)/104.1/2.

p.est=(60+2)/(10+4)
p.est + qnorm(c(.025,.975)) * sqrt( p.est*(1-p.est)/104 )
[1] 0.5018524 0.6904553

最后,Jeffries 95% CI 使用 分布 ,因此区间为0.0250.975BETA(60+0.5,40+0.5),(0.5023,0.6920).

qbeta(c(.025,.975), 60.5, 40.5)
[1] 0.5022567 0.6920477

根据您使用的间隔类型以及您是否希望最小的数字足够大以使 CI 不包含剩下的交给您。1/2,

我对种子发芽问题进行了类似的数学运算,以从其中 k 个发芽的 n 个种子样本中估算种群发芽率。

我得到的 CDF 公式是:

计算机友好的二项式 CDF

其中 x 是发芽概率。代入您的问题变量,令 n 为掷硬币的次数,k 为 0.6*n,因此得到的公式为:

特定问题的 CDF

你可以解出 n 得到总翻转次数,这将排除具有 95% 可信度的公平硬币。请注意,这是一个可信区间,而不是一个 CONFIDENCE 区间。我不知道这将如何使用精确的 60% 而不是 n 和 k 的整数值,但通用 CDF 公式可以让您在任意可信区间内到达那里。让 x 等于 0.5 的“公平硬币概率”,k 是正面的数量,n 是翻转的总数。

实际上,我为种子发芽问题制作了一个Javascript 计算器,您可以选择用于此用途。如果您想查看或检查它,还有一个指向计算出的数学 PDF 的链接。希望这可以帮助!

更新:我用我的计算器蛮力计算,我计算出 95% 的可信区间不包括在 95 到 100 次硬币翻转之间的公平硬币(50% 概率)。附上带有 n 的可信区间演化图。

硬币翻转