I 类错误率是等于 alpha 还是至多是 alpha?

机器算法验证 假设检验 p 值 类型 i 和 ii 错误
2022-03-03 19:25:17

根据p 值 Wikipedia 页面

当 p 值计算正确时,此检验保证 I 类错误率最多为α.

然而,在页面的下方,给出了这个公式:

Pr(RejectH|H)=Pr(pα|H)=α

假设“类型 1 错误率”= Pr(RejectH|H)这表明类型 1 错误率是α而不是'最多α'。否则,公式将显示为:

Pr(RejectH|H)α

我的误解在哪里?

2个回答

当“零假设”包括一种以上的自然状态时,实际的误报率 (FPR) 可能会随该状态而变化。我们所能做的就是保证对 FPR 的限制,无论这种自然状态可能是什么——但我们不能总是保证 FPR 实际上等于 α.

(还有其他原因导致 FPR 实际上可能不等于其目标值α,例如当检验统计量是离散的时。这些情况通常可以通过使用随机决策程序来解决。因此,它们没有提供对该问题的任何基本见解。)


考虑经典的单尾检验,其中统计量X假设具有未知均值的正态分布μ和(为简单起见)已知标准偏差σ. μ是要比较的0. 原假设是H0:μ0而备择假设是HA:μ<0. 因此,拒绝区域的形式为

R(α)=(,Zα]

在哪里Zα选择使得在该区域观察统计数据的机会最多为 α

(1)α=sup(Pr(XR(α))).

在假设下,这个概率由正态分布函数给出Φ

(2)Pr(XR(α))=Φ(Zαμσ).

这个概率取决于未知值μ. 因此我们不能保证它实际上等于α. 确实,对于大μ,(2)几乎为零。但是,我们必须覆盖我们所有的基地,并保证只要μ与原假设一致,误报率(1)不会超过α.

这是一个偷偷摸摸的问题。如果您有连续的数据,并且您对它们进行了适当的处理,那么Pr(pα|H0)=α. 但是,当您的数据是离散的时,可能无法p=α. 考虑硬币是否公平的二项式数据,抛硬币 5 次,可能的单边 p 值是:

> pbinom(0:5, size=5, prob=.5)
[1] 0.03125 0.18750 0.50000 0.81250 0.96875 1.00000

仅有的0head 可能会产生 I 类错误,与此相关的概率是0.03. 那么第一类错误率被保持为“至多α",但不等于 α.

另一方面,有(无效的)分析策略导致 I 类错误率大于 α,即使当p<α(例如,逐步选择例程)。

我在这里进行了更全面的讨论:比较和对比、p 值、显着性水平和 I 型错误