解释一尾和二尾测试

机器算法验证 假设检验 统计学意义 p 值 单尾测试
2022-04-03 21:42:34

如何报告双尾检验的 p 值为 0.08 和单尾检验的 p 值为 0.04 的结果?概括这个问题,如果您从双尾检验中获得介于 0.05 和 0.9999 之间的 p 值,那么在 p 值小于 0.05 的方向上进行单尾检验是否有意义?

2个回答

您不会根据双尾检验中的近显着性来选择单尾检验。

您不会根据数据中的方向信息来选择单尾测试的方向。

或者至少,如果你做这些事情,你还必须将得到的 p 值加倍。

单尾测试——如果你做一个测试——必须基于事先考虑,在你知道数据中有什么之前就位。如果不是这种情况,则显着性水平(和 p 值)是没有意义的。

报告与您的假设相对应的结果,该假设应该是单尾或双尾,而不是两者。在进行测试之前,您应该能够在理论上决定哪个是合适的。一旦你决定了,报告你计算出来的p值。如果它非常小,请考虑在回答这个问题时的建议:如何小p- 值被报告?(为什么 R 在 2.22e-16 上设置最小值?)如果您使用 Neyman-Pearson 方法来解释您的p值,您可能知道如何根据误报错误来决定是拒绝还是保留您的原假设率,您还必须提前选择。

在对其他等价的原假设进行双边检验之后应用单边检验是不正确的。同样,根据您的理论目标,一个或另一个是合适的,而不是两者都合适。如果双面测试是合适的,您使用的是 Neyman–Pearson 框架,并且您没有拒绝 null,那么这就是您的结果。如果这不符合您的目的,您仍然可以复制该研究并查看下一次结果如何,但即使第二个拒绝 null 结果,也不要不报告您的第一个 null 结果。这是文件抽屉效应的主要原因之一,这是元分析师最可怕的噩梦。

有关了解单尾测试和双尾测试之间差异的更多信息,请参阅: