维基百科的例子说,如果硬币生成序列 1111111,那么它是不公平的。高交替率,例如 1010101010,同样是不公平的。
认为硬币是不公平的,因为它同样不可能看到任何序列,这是什么谬误?
我的意思是它通常通过说明 P(11111111) = P(00000000) = P(01010101) = P(10101010) = P (010101000) = P(任何其他序列)这一事实来“解决”。这说明硬币是公平的。但是,我将其解释为不可能仅仅因为所有概率的同一性以及因为 P(all one) = P(any sequence) 等而存在任何公平的硬币,所有这些都是极不可能的。
现在,我们有公平的硬币不可能是公平的。谬误在哪里以及如何正确应用 p 检验?
编辑假设是硬币是公平的,统计是发生序列的概率。我可以根据假设计算发生序列的概率。对于任何足够长的序列,理论概率太低,因此必须拒绝公平。谬误在哪里?
编辑2为什么没有人可以简单地说在第一个维基百科示例中指出了陷阱:p-criteria 没有考虑样本量?我什至可以轻视这个问题。忘记系列。让我们在假设均匀 0-100 分布的情况下评估选择单个项目 38 的概率。显然,它是 1%,这足够低,可以被偶然选择。但是,统计数据显示该项目出现在 100% 的案例中(每 1 次实验 1 次)。这显然不是偶然的,根据p-level检验,样本量也不足。因此,p检验必须辅以样本量分析。忘记这一点是错误的。正确的?
一个相关的问题:如果我抽取多个样本,哪个分布有选择 item38 的概率?如何取“极端情况”的积分?
