为什么统计文献中没有那么多强调 II 型错误?

机器算法验证 假设检验 类型 i 和 ii 错误
2022-03-10 19:43:11

我已经在各种研究文章中看到了许多 I 类错误被解释(用 alpha 值表示)的情况。我发现研究人员很少会考虑功率或 II 型错误。

II 型错误可能很严重,对吗?当它实际上是错误的时,我们不小心拒绝了替代假设。为什么如此强调阿尔法值而不是贝塔值?

当我学习第一年的统计数据时,我从来没有被教过测试版——只有阿尔法版。我觉得这两个错误应该平等对待。然而,似乎只强调了阿尔法。

2个回答

这是一个很好的问题。让我从几个澄清开始:


我认为您(不幸地)是对的,即较少关注权力和 II 型错误。虽然我认为生物医学研究的情况正在改善(例如,资助机构和 IRB 现在经常需要进行功率分析),但我认为有以下几个原因:

  1. 我认为权力对于人们来说比简单的意义更难理解。(这部分是因为它取决于很多未知数——尤其是效应大小,但还有其他的)。
  2. 大多数科学(即,除了物理和化学)都没有很好地数学化。因此,研究人员很难知道他们的理论“应该”给出多大的效应大小(不仅仅是0)。
  3. 科学家们传统上认为 I 型错误比 II 型错误更糟糕。

原因是我们根本不知道实际的 II 型错误率,而且我们永远也不会知道。这取决于我们通常不知道的参数。反过来,如果我们知道这个参数,我们就不需要进行统计测试。

但是,我们可以计划一个实验,以便满足特定的 II 类错误率,前提是某些替代方案是正确的。这样,我们将选择一个不浪费资源的样本量:要么是因为测试最终没有拒绝,要么因为已经小得多的样本量足以拒绝假设。