机器算法验证 - 测试硬币是否公平 - 吾爱随笔录

测试硬币是否公平

机器算法验证最大似然 p 值

2022-03-26 02:27:20

我掷硬币 20 次，得到 14 个正面。我想计算我的硬币是公平的假设的 p 值。

我应该计算什么概率？

维基百科说我需要计算在 20 次翻转中获得 14次或更多正面的概率。

为什么是 14“或更多”？为什么不是 14或更少？

1个回答

这既不是因为公平的替代方案是硬币有利于正面或反面。

你可以自由地发明任何你喜欢的测试。例如，当且仅当正面的数量为 6 或 15（“关键区域”）时，我可以（特殊地）确定硬币是不公平的，因为当硬币公平时，此事件发生的几率只有 5%。 关键问题是测试的执行情况如何。Neyman-Pearson 引理表明我刚刚发明的这个特殊的测试是一个糟糕的测试。一个好的测试是这样一个测试，它的临界区域不仅在 null 为真时不太可能，而且在 null 为假时也很有可能。

这种双边测试没有一个最佳临界区域，但一个合理的折衷方案是采用一种程序来检测双向的公平偏差。这表明一个包含最极端可能性的关键区域：0 附近的一堆和 20 附近的一堆。在 5% 的水平上，一个不错的选择是将 15 或更多或5 或更少的任何结果视为显着。

然后让我们对公平硬币采用最佳对称测试。这意味着我们希望关键区域包括 $20-i$ 每当它包括 $i$ 头（也就是说， $20-i$ 尾巴）。这平等对待正面和反面。 只有在特定测试（例如这个测试）的上下文中，p 值才有意义。 根据定义，对应于结果 14 的 p 值是在其关键区域中包括 14 的任何此类检验的最小显着性。根据对称性，它必须包括 20 - 14 = 6，根据 Neyman-Pearson 引理，它必须包括所有大于 14 的值和所有小于 6 的值。在空值下出现这种情况的几率是 11.53%。随着正面朝上的机会越来越多地偏离任一方向的 1/2，这种机会会均匀增加。

其它你可能感兴趣的问题

上一篇随机时间序列组件的“系统”部分？下一篇在统计中使用辛几何的参考资料？