似乎统计学家通常只对统计能力感兴趣。换句话说,他们对正确拒绝原假设的概率感兴趣。
- 如果我们对正确不拒绝原假设的概率感兴趣怎么办?
- 我们会改变假设检验,以便我们计算幂吗?
似乎统计学家通常只对统计能力感兴趣。换句话说,他们对正确拒绝原假设的概率感兴趣。
“正确地不拒绝原假设”的概率——即,如果原假设为真,我们不拒绝它——由我们进行检验的显着性水平控制。如果我选择的显着性水平,如果我的值小于 0.05 则我拒绝,那么我正确不拒绝零假设的概率是。如果在实际上为真时拒绝原假设会产生非常糟糕的后果,那么我们可能会使用较小的,例如 0.01 甚至 0.001,这使我们有更高的概率正确地不拒绝原假设。
所以,其实我们已经控制了这个概率——其实这比权力容易控制得多。因为它更容易,所以关于它的讨论要少得多,这可能就是你得出结论说统计学家对它不感兴趣的原因。
我认为您对等效性测试感兴趣。请参阅有关测试没有组差异的假设的其他问题。
可以采用多种方法来评估零假设是否为真。一般来说,缺乏统计学上的显着效果是零假设真实性的非常周的证据。
三种常见的方法包括 (a) 查看置信区间;(b) 查看感兴趣参数的贝叶斯后验密度;(c) 设置两个单边显着性检验。
置信区间和贝叶斯后验密度方法通常用于量化感兴趣参数的不确定性。贝叶斯方法可以说更符合参数被视为未知的感兴趣问题。查看这些区间,您可以判断,如果区间包括原假设并且其他合理值足够接近零,那么这意味着原假设或足够相似的东西最有可能是事实。
类似的方法是设置两个单边显着性检验。例如,当测试两组的均值是否相同()时,您可以测试是否显着小于 .1 和显着大于 -.1 . 在这种情况下,您可以计算此类测试的统计功效,假设:
或者,如果您想保持功率不变,那么您可以评估所需的样本量。您还可以更改等效阈值,并查看当您扩展等效阈值的宽度时,您的功率如何增加。
这是药物等效性和非劣效性测试中常见的应用问题(例如,Walker 和 Nowacki,2011)。