我掷硬币 20 次,得到 14 个正面。我想计算我的硬币是公平的假设的 p 值。
我应该计算什么概率?
维基百科说我需要计算在 20 次翻转中获得 14次或更多正面的概率。
为什么是 14“或更多”?为什么不是 14或更少?
我掷硬币 20 次,得到 14 个正面。我想计算我的硬币是公平的假设的 p 值。
我应该计算什么概率?
维基百科说我需要计算在 20 次翻转中获得 14次或更多正面的概率。
为什么是 14“或更多”?为什么不是 14或更少?
这既不是因为公平的替代方案是硬币有利于正面或反面。
你可以自由地发明任何你喜欢的测试。例如,当且仅当正面的数量为 6 或 15(“关键区域”)时,我可以(特殊地)确定硬币是不公平的,因为当硬币公平时,此事件发生的几率只有 5%。 关键问题是测试的执行情况如何。Neyman-Pearson 引理表明我刚刚发明的这个特殊的测试是一个糟糕的测试。一个好的测试是这样一个测试,它的临界区域不仅在 null 为真时不太可能,而且在 null 为假时也很有可能。
这种双边测试没有一个最佳临界区域,但一个合理的折衷方案是采用一种程序来检测双向的公平偏差。这表明一个包含最极端可能性的关键区域:0 附近的一堆和 20 附近的一堆。在 5% 的水平上,一个不错的选择是将 15 或更多或5 或更少的任何结果视为显着。
然后让我们对公平硬币采用最佳对称测试。这意味着我们希望关键区域包括每当它包括头(也就是说,尾巴)。这平等对待正面和反面。 只有在特定测试(例如这个测试)的上下文中,p 值才有意义。 根据定义,对应于结果 14 的 p 值是在其关键区域中包括 14 的任何此类检验的最小显着性。根据对称性,它必须包括 20 - 14 = 6,根据 Neyman-Pearson 引理,它必须包括所有大于 14 的值和所有小于 6 的值。在空值下出现这种情况的几率是 11.53%。随着正面朝上的机会越来越多地偏离任一方向的 1/2,这种机会会均匀增加。