为什么教学生 p 值是发现是偶然的概率是不好的?

机器算法验证 p 值 随机性 教学
2022-01-18 21:16:02

有人可以提供一个简洁的解释,为什么教学生 p 值是概率不是一个好主意(他们的发现是由于 [随机] 机会)。我的理解是 p 值是概率(获得更多极端数据 | 零假设为真)。

我真正感兴趣的是告诉他们这是前者有什么害处(除了事实并非如此)。

4个回答

我对错误陈述的含义的解释与@Karl 不同。我认为这是关于数据的陈述,而不是关于空值的陈述。我将其理解为询问由于机会而获得您的估计的概率。我不知道这意味着什么——这不是一个明确的声明。

但是,鉴于真实估计值等于特定值,我确实理解偶然得到我的估计值的概率可能意味着什么。例如,考虑到男性和女性的平均身高实际上相同,我可以理解男性和女性的平均身高差异很大意味着什么。这很明确。这就是 p 值给出的。错误语句中缺少的是 null 为真的条件。

现在,我们可能会反对这不是完美的陈述(例如,获得估计量的准确值的机会是 0)。但这比大多数人解释 p 值的方式要好得多。

当我教授假设检验时,我一遍又一遍地说的关键点是“第一步是假设零假设是正确的。一切都是在这个假设下计算出来的。” 如果人们记得这一点,那就太好了。

我经常看到这种解释(可能比正确的解释更频繁)。我将“他们的发现是由于 [随机] 机会”解释为“是真的”,所以他们所说的是 [实际上应该是 ; 说,“给定我们所看到的(数据),只有机会在起作用的概率是多少?”] 这可能是一个有意义的陈述(如果你愿意分配先验并做贝叶斯),它不是 p -值H0Pr(H0)Pr(H0|data)

Pr(H0|data)可能与 p 值完全不同,因此以这种方式解释 p 值可能会严重误导。

最简单的说明:假设先验,非常小,但一个数据相当少,因此 p 值较大(例如,0.3),但后验,,仍然很小。[但也许这个例子并不那么有趣。]Pr(H0)Pr(H0|data)

我将从(前)学生的角度添加一个迟到的答案:恕我直言,伤害不能与其错误分开。

这种错误的“教学近似/捷径”会给那些意识到自己无法从逻辑上理解该陈述的学生造成很多困惑,但假设教给他们的内容是正确的,他们却没有意识到自己无法理解它因为这是不对的。

这不会影响只记住呈现给他们的规则的学生。但它要求通过理解学习的学生足够优秀

  • 自己得出正确的解决方案,并
  • 足够好,这样他们就可以确定他们是对的
  • 并得出结论,他们被教导胡说八道(出于某种据称是说教的原因)。

我并不是说没有有效的教学捷径。但是恕我直言,当采取这样的捷径时,应该提到这一点(例如,“为了便于论证,我们假设/近似......”)。
然而,在这种特殊情况下,我认为它太误导了,没有任何用处。

直接提到问题:伤害在哪里?

在我看来,这个问题的答案与陈述相反,“p 值是发现是由于随机机会造成的概率。” 如果有人相信这一点,那么人们也可能相信以下观点:“[1-(p-value)] 是发现不是随机机会的概率。”

危害就在于第二个陈述,因为考虑到大多数人大脑的工作方式,这个陈述严重高估了我们应该对估计参数的具体值有多大的信心。