拒绝原假设是否与波普尔的证伪理论有关?

机器算法验证 假设检验 哲学的
2022-02-02 06:55:59

根据波普尔的说法,由于归纳问题,我们无法验证假设——我们只能旨在证伪它。如果我们一再无法证伪它,则该假设被认为是暂时接受的。对于波普尔来说,所有的科学都应该提出假设,并尽可能努力地证伪它们。

在一些统计假设检验的介绍中,我可以读到科学家旨在证伪零假设,这在某种程度上符合波普尔的证伪理论。是一个帖子,陈述了这种观点。(用户@Stefan 确实评论了这篇文章,这正是我的观点。)

我有三个问题:

  1. 波普尔不是说我们应该尝试证伪替代假设吗?
  2. 证伪原假设是否算作对备择假设的证伪失败?
  3. 可能是一些语义上的诡辩:科学家不应该试图证实零假设而不是试图证伪它吗?

(如果这个帖子应该在“哲学”版块,请移到那里...)

3个回答

我还打算在评论中指出黛博拉梅奥的作品。她是受波普尔影响的哲学家,写过很多关于统计检验的文章。

我将尝试解决这些问题。

(1a) 波普尔根本不认为统计检验是他方法的形式化。Mayo 说这是因为 Popper 在统计方面不够专业,而且他可能不会允许将 5% 或 1% 的错误概率视为“伪造”(Mayo 也可能在某处提到过这一点,但我没有不记得了)。

(1b) 选择零假设和备择假设有不同的方法。在某些应用中,零假设是一个精确的科学理论,我们检查数据是否证伪它。这将与 Popper 一致(至少如果他允许非零错误概率)。在其他一些方法中(在许多领域,这种情况更常见),零假设形式化了“没有任何意义的事情正在发生”的想法,而替代方案具有实际的科学意义。符合波普尔的观点。(此外,通常没有足够精确地指定替代方案以暗示伪造的条件,并且是统计的。)

(2) 根据统计检验的标准逻辑,原假设可以在统计上(即具有错误概率)被证伪,但不能替代。有可能争辩说另一种选择在统计上是错误的,但这基本上相当于反过来运行测试。例如,如果你有一个和一个替代,你不能伪造替代(因为它允许任意接近 0,这不能通过来自 ),但您可以声明的有意义的偏差 实际上是,在这种情况下,您可以拒绝H0: μ=0μ0μμ=0μ=0|μ|2|μ|2如果非常接近于零。的原始检验的功效足够大,以至于在这种情况下“接近于零”的可能性很小,这是有道理的。(这与 Mayo 的“严重性”概念有关;在这种情况下,我们可以说 “具有严重性”。)我们也可以说我们“在统计上伪造了” .x¯|μ|2x¯|μ|<2|μ|2

(3) 这确实是一个哲学问题,我已经看到了两个方向的争论。

太长的评论,所以这里是我的想法。

零假设统计检验 (NHST) 只是波普尔式的,因为没有多少佐证可以证明假设是正确的,所以通常你能做的最好的事情就是找出你可以合理拒绝的东西,并继续提出那些在抛出的测试中幸存下来的假设到目前为止。

首先,我们应该避免谈论伪造原假设,而应该坚持“拒绝”或“不拒绝”。能够拒绝原假设并不意味着我们已经证明它是错误的,只是在该假设下观察结果不太可能。在替代假设下,观察结果可能更不可能!这是一个经典的例子:

在此处输入图像描述

在这种情况下,零假设几乎可以肯定是正确的,即使我们拒绝了它,检测器也几乎肯定会给出随机错误警报。这是因为备择假设比原假设更不可能为真,因为 H1 的先验概率远小于 H0 的先验概率,但 NHST 没有考虑到这一点。这是一个拒绝原假设不是对备择假设的失败证伪的例子。

相反,如果 NHST 的统计功效较低,则无法拒绝零值不会证伪备择假设。

正如@Dave 所建议的那样,有时我们肯定先验地知道原假设是错误的,例如,有两个面的硬币不太可能完全无偏,即 p(head) = p(tail) = 0.5,但我们可能需要大量的硬币翻转来检测必然存在的偏见,即使在所有意图和目的都“无偏见”的硬币中也是如此。在大多数情况下,正态性测试涉及一个类似的问题,即 AFAICS。拒绝一个你从一开始就知道是错误的假设并不是非常波普尔式的,但这并不意味着这样的 NHST 不能执行有用的目的。

Quine-Duhem命题表明,在实践中,证伪一个假设也不是那么容易。

Richard McElreath 的二手货,但我认为没有。波普尔著名的证伪理论是关于证伪实验假设而不是零假设。