你抛硬币 n 次,你观察到 60% 的次数是正面。
n 需要多大才能达到 95% 的置信度,即它不是一枚公平的硬币?
=======
尝试:基本上使用二项分布,但我不知道如何将 60% 的数字考虑到我的计算中。
,所以 = 1.6
你抛硬币 n 次,你观察到 60% 的次数是正面。
n 需要多大才能达到 95% 的置信度,即它不是一枚公平的硬币?
=======
尝试:基本上使用二项分布,但我不知道如何将 60% 的数字考虑到我的计算中。
,所以 = 1.6
您希望足够大,使得置信区间为其中是正面的数量,不包括
粗略地说,标准误差为 ,误差范围约为并且您希望边际误差小于因此左右就足够了。我在下面展示了的示例。
n = 100; x = 60; z = qnorm(c(.025,.975))
CI = .6 + z*sqrt(.24/100); CI
[1] 0.5039818 0.6960182
由于 Agresti 和 Coull 的一种优越的 CI 使用点估计并且端点在这个间隔也只是错过了覆盖
p.est=(60+2)/(10+4)
p.est + qnorm(c(.025,.975)) * sqrt( p.est*(1-p.est)/104 )
[1] 0.5018524 0.6904553
最后,Jeffries 95% CI 使用 分布和 ,因此区间为
qbeta(c(.025,.975), 60.5, 40.5)
[1] 0.5022567 0.6920477
根据您使用的间隔类型以及您是否希望最小的数字足够大以使 CI 不包含剩下的交给您。
我对种子发芽问题进行了类似的数学运算,以从其中 k 个发芽的 n 个种子样本中估算种群发芽率。
我得到的 CDF 公式是:
其中 x 是发芽概率。代入您的问题变量,令 n 为掷硬币的次数,k 为 0.6*n,因此得到的公式为:
你可以解出 n 得到总翻转次数,这将排除具有 95% 可信度的公平硬币。请注意,这是一个可信区间,而不是一个 CONFIDENCE 区间。我不知道这将如何使用精确的 60% 而不是 n 和 k 的整数值,但通用 CDF 公式可以让您在任意可信区间内到达那里。让 x 等于 0.5 的“公平硬币概率”,k 是正面的数量,n 是翻转的总数。
实际上,我为种子发芽问题制作了一个Javascript 计算器,您可以选择用于此用途。如果您想查看或检查它,还有一个指向计算出的数学 PDF 的链接。希望这可以帮助!
更新:我用我的计算器蛮力计算,我计算出 95% 的可信区间不包括在 95 到 100 次硬币翻转之间的公平硬币(50% 概率)。附上带有 n 的可信区间演化图。