基于 Neyman-Pearson 假设检验理论,不拒绝原假设是否意味着应该接受原假设?
(如果采用Fisher 的零假设检验理论,这种说法绝对是荒谬的,但如果选择NPHT 岂不是有意义?)
基于 Neyman-Pearson 假设检验理论,不拒绝原假设是否意味着应该接受原假设?
(如果采用Fisher 的零假设检验理论,这种说法绝对是荒谬的,但如果选择NPHT 岂不是有意义?)
如果“Neymann-Pearson 方法”被狭义地理解为通过在原假设之外引入替代假设来扩展 Fisher 的方法,那么就没有改变术语的动机。备选方案只能影响检验统计量的选择(通过考虑检验的功效);一旦做出选择,检验统计量的分布就会在零值下计算。“未能拒绝”反映了零假设和替代假设之间的这种不对称性†; 在积累足够的相反证据之前,您暂时假设 null 为真。(“保留”是另一种表达方式。)教育家们努力使用这种良好的语义区分,试图避免这样一种误解,即“微不足道”的结果必然反映了反对替代方案的证据优势。例如,考虑来自具有单位方差和未知均值的高斯分布的单个观测值,. 与点 null & 替代对比, 大小检验仅在以下情况下拒绝 null, 即使替代方案在任何时候都得到更好的支持.
另一方面,如果您要认真对待 NP 方法的决策理论框架(请参阅此处的出色答案),那么您就不会费心执行对您的目的而言动力不足的测试;然后谈论“接受”零假设似乎更明智。从这个观点出发,一些著名的测试理论阐释者显然是这么认为的。Lehmann & Romano (2005),Testing Statistical Hypotheses,自始至终毫不掩饰地使用“接受”和“拒绝”。Casella & Berger (2002),统计推断,也使用“接受”和“拒绝”,甚至说“或者“。‡
† 当空值的复合(通过指定参数值的范围,或者由于没有通过对辅助统计量进行调节而消除的有害参数)时,不对称性会加剧,在这种情况下,除非检验统计量是在其任何构成简单零点下都足够极端。
‡ 在 Cox & Hinkley (1974) Theoretical Statistics中,管理四个关于测试的章节,而不使用“accept”或“reject”,除了一次在吓人的引用中。