至于第一个批评,它可以是对任何和所有科学分支的批评。没有完全可重复的实验。完全控制任何实验是不可能的。例如,流星可能会撞击实验的位置。
此外,重复实验的能力也无关紧要。大多数频率论推论的形式为。该框架中的频率是一种限制形式。如果模型为真,则 p 值有意义。更好的批评是“当模型不正确时会发生什么?” 这是一个很好的批评,因为你的 null 通常与你真正相信的相反。Pr(t(x)|θ)
频率论频率不是口语意义上的概率。它们是提供保证的概率。除了精确测试,当您阅读时,它实际上并不意味着。它只是保证假阳性率(如果 null 为真)在无限次重复中不会超过 5%。然而,随着重复次数变得足够大,它会趋于收敛。p<.05p=.05
确实,一个人不能做无限次的重复,如果你只做一个样本,它可能是 100% 错误的。尽管如此,它确实提供了一种合理的推理和决策方式。它允许您控制被愚弄的频率。它不允许你说这一次不是我将成为傻瓜的时候。
困难不在于数学或使用,而在于人类需要没有误报或误报。问题在于人类需要统计显着性以完美地映射到真实的事物,而缺乏对虚假事物的意义。
第二个批评是对任何概率方法的有效批评。由于贝叶斯方法构造背后的逻辑,贝叶斯方法可能更好地处理这种批评,这可能是真的。
如果您需要对此保持纯粹的态度,那么可以将频率方法的使用限制在真正没有先验知识或真正感兴趣的零假设为尖锐零的情况下。
让我来说明这一点。
你有一个美国硬币,你将在一个特制的真空室中用精心构造的抛硬币机抛掷 50,000 次。您想确定硬币是否公平。
即使你认为这些硬币“大致公平”,放弃这种信念也是合理的,除非真的对美国硬币的公平性进行了对照研究。作为旁注,一组工程专业的学生已经完成了这样的研究。
折腾是完全确定性的并且高度受控。目前尚不清楚频率论方法在此处将如何处于不利地位。
现在让我们重做一下实验。
让我们假装你和我要在硬币的公平性上赌钱。确实,我相信硬币是如此不公平,以至于它会连续十次出现正面。你相信这是一枚公平的硬币。在赌博任何钱之前,我们将进行试点研究,并让第三方掷硬币十次。它出现了十分之六的正面。
所以我要求你以 500:1 的赔率下注。我将掷硬币十次。
就在你这样做之前,一位朋友在你耳边低语说我是我叔叔的学徒,他是一名舞台魔术师。另外,有人告诉你,我被逮捕了,但没有被定罪,因为我用化名 Slick Eddy 参与了一些街头游戏,比如三张牌蒙特和硬币游戏。指控被撤销是因为,尽管我可能与被指控的肇事者有着惊人的相似之处,但没有人愿意出面指认我在警察阵容中的身份。
您不想将这些信息与贝叶斯先验结合起来吗?
确实没有随机抛硬币这样的事情。任何物理学家、魔术师或骗子都会告诉你同样的事情。
频率论者方法会告诉你整个过程是不公平的,事后,但它不允许你纳入所有外部信息。频率论方法在构造上是完全准确的,但在这种情况下,结果估计量本质上不太精确。
第二个论点是符合目的。频率统计并不是人类所有疾病的万能药。它们是工具包中的工具。
让我们把上面的例子颠倒过来。
想象一下,你真的不具备任何你必须做出决定的外部知识。您确实有能力收集样本,并且可以使用贝叶斯或频率统计。
频率统计最小化了您需要承担的最大风险。贝叶斯方法没有。频率论方法尽管没有背景信息,但提供了有保证的性能水平。在真正无知的状态下,拥有它是一件很有价值的事情。贝叶斯方法不能做到这一点。