考虑规模水平的统计假设检验用于检验零假设反对另一种假设. 我知道如果它的幂函数测试被认为是“无偏的”满足条件:
我理解定义,但我不明白这对测试意味着什么?这是否意味着测试具有超出其应有的能力?您如何比较两种测试的力量,一种是“有偏见的”,另一种是“无偏见的”?
考虑规模水平的统计假设检验用于检验零假设反对另一种假设. 我知道如果它的幂函数测试被认为是“无偏的”满足条件:
我理解定义,但我不明白这对测试意味着什么?这是否意味着测试具有超出其应有的能力?您如何比较两种测试的力量,一种是“有偏见的”,另一种是“无偏见的”?
这意味着当备选方案为真时,测试拒绝的概率(其能力)总是高于空值为真时的概率。
例如,假设您对 null 使用标准 t 检验反对替代方案. 标准拒绝规则如果(对于来自正态分布的样本或渐近分布的样本,当中心极限定理适用时)。
现在,假设您要使用该规则(如果) 去测试反对. 测试拒绝的概率将降低,因为在这种情况下我们很少会观察到大的正 t 比率。特别是,这个测试是有偏见的,因为什么时候.
具体来说,我们可以在正常情况下明确计算这个概率,, 和假定为简单起见。然后,t 统计量为简直就是和
theta.grid <- seq(-.8,.8,by=.01)
n <- seq(10,90,by=20)
power <- 1-pnorm(qnorm(.95)-outer(theta.grid,sqrt(n),"*"))
colors <- c("#DB2828", "#40AD64", "#E0B43A", "#2A49A1", "#7A7969")
matplot(theta.grid,power, type="l", lwd=2, lty=1, col=colors)
legend("topleft", legend=paste0("n=",n), col=colors, lty=1, lwd=2)
abline(h=0.05)