测试硬币是否公平

机器算法验证 最大似然 p 值
2022-03-26 02:27:20

我掷硬币 20 次,得到 14 个正面。我想计算我的硬币是公平的假设的 p 值。

我应该计算什么概率?

维基百科说我需要计算在 20 次翻转中获得 14次或更多正面的概率。

为什么是 14“或更多”?为什么不是 14或更少

1个回答

这既不是因为公平的替代方案是硬币有利于正面反面。

你可以自由地发明任何你喜欢的测试。例如,当且仅当正面的数量为 6 或 15(“关键区域”)时,我可以(特殊地)确定硬币是不公平的,因为当硬币公平时,此事件发生的几率只有 5%。 关键问题是测试的执行情况如何Neyman-Pearson 引理表明我刚刚发明的这个特殊的测试是一个糟糕的测试一个好的测试是这样一个测试,它的临界区域不仅在 null 为真时不太可能,而且在 null 为假时也很有可能。

这种双边测试没有一个最佳临界区域,但一个合理的折衷方案是采用一种程序来检测双向的公平偏差。这表明一个包含最极端可能性的关键区域:0 附近的一堆和 20 附近的一堆。在 5% 的水平上,一个不错的选择是将 15 或更多5 或更少的任何结果视为显着。

然后让我们对公平硬币采用最佳对称测试。这意味着我们希望关键区域包括20i每当它包括i头(也就是说,20i尾巴)。这平等对待正面和反面。 只有在特定测试(例如这个测试)的上下文中,p 值才有意义。 根据定义,对应于结果 14 的 p 值是在其关键区域中包括 14 的任何此类检验的最小显着性。根据对称性,它必须包括 20 - 14 = 6,根据 Neyman-Pearson 引理,它必须包括所有大于 14 的值和所有小于 6 的值。在空值下出现这种情况的几率是 11.53%。随着正面朝上的机会越来越多地偏离任一方向的 1/2,这种机会会均匀增加。