或时,你拒绝原假设吗?p < αp<αp≤α _ _p≤α

机器算法验证 假设检验 统计学意义 定义
2022-02-09 09:19:08

这显然只是一个定义或约定的问题,几乎没有实际意义。如果设置为其传统值 0.05,那么值 0.0500000000000 是否被认为具有统计显着性?定义统计显着性的规则通常被认为是还是αpp<αpα

2个回答

依靠 Lehmann 和 Romano,检验统计假设,定义为拒绝区域,将定义为原假设区域,松散地说,我们有以下陈述,p。57 在我的副本中:S1ΩH

因此,人们选择一个介于 0 和 1 之间 ,称为显着性水平,并施加以下条件:α

...Pθ{XS1}α for all θΩH

由于是可能的,因此您会拒绝 p 值Pθ{XS1}=αα

在更直观的层面上,想象一个离散参数空间的检验,以及在原假设下概率恰好为 0.05 的最佳(最强大)拒绝区域。假设下一个最大(就概率而言)最佳拒绝区域在原假设下的概率为 0.001。再次直观地说,说第一个区域不等于“在 95% 的置信水平……”的决定,但你必须使用第二个区域才能达到 95%,这有点难以证明信心水平。

您谈到了一个有趣且颇具争议的问题。这张图片可以幽默地总结这一点(在Andrew Gelman 的博客上找到,但最初由Dan Goldstein提供):

神奇的 p 值

首先,0.05 没有什么神奇之处。只要您事先选择阈值,0.1 或 0.01 的阈值就同样有意义。为此,选择您想要使用的截止值同样合理,前提是您在观察 p 值后没有通过更改截止值来作弊。<.05.05

如果您想从最严格的意义上看这个,如果您事先选择了的截止值(我认为它更“标准”)并且您观察到 p 完全等于 0.05,从技术上讲,您会在标准的常客技术下作弊。但其中存在整个方法的部分问题。我们正在从根本不是一个真正的二元问题的东西中制造一个二元问题“统计显着与否”。正如 Andrew Gelman 和 Hal Stern恰当地指出的那样,“‘显着’和‘不显着’之间的差异本身在统计上并不显着。”<.05