为什么具有中等小和非常高功率的实验如此罕见?α
这有点相对,但可以肯定的是,显着性水平已经很弱,并且已经构成了为更高功率做出的牺牲(例如,相对于显着性水平或其他较低的显着性水平)。虽然对此的看法会有所不同,但我个人的看法是,这已经是一个非常弱的显着性水平,所以选择它已经是获得更高功率的权衡。α=0.05α=0.01
根据我的理解,在进行了一个实验之后,如果结果不显着,那么显着性水平根本就无关紧要,因为在这种情况下,我们正在考虑接受零值是否有意义,而我们关心的只是是权力。同样,如果结果显着,则显着性水平成为您的证据,而检验的功效绝对为零。
我明白你为什么会这样想,但事实并非如此。在经典假设检验中,这些事物之间存在相当复杂和微妙的相互作用。请记住,p 值和功效都与以假设的真实状态为条件的概率有关(零值的 p 值条件和备选方案的功效条件)。当您从数据中获得结果时,您可以对假设进行推断,但您仍然不知道它们的真实状态。因此,说您可以完全忽略测试的“另一半”是不合理的。无论结果在统计上是否显着,对该结果的解释都是针对测试的所有属性进行的。
还值得注意的是,对于固定的模型和测试以及固定的样本量,功效函数是所选显着性水平的函数。选择的显着性水平决定了拒绝区域,这直接影响了检验的功效。再说一遍,这些东西之间是有关系的,你不能忽略测试的“一半”属性。
最后,同样重要的是要注意,执行经典统计测试的从业者通常只会报告测试的 p 值,如果需要二元决策,则让读者选择自己的显着性水平。(除非特别需要立即得出二元结论,否则这是我的首选方法。)现代统计文献强烈警告不要在不给出潜在 p 值的情况下将假设检验的报告结果减少为二元。因此,在许多实际情况下,显着性水平不是在分析之前选择的,也可能根本不是由进行测试的分析师选择的。