大p值是什么意思?

机器算法验证 假设检验 p 值
2022-03-21 18:41:48

我知道值是观察检验统计量的条件概率,或者假设原假设为真,则更为极端。我在这篇文章中阅读了@user28 的精彩解释:统计测试中 p 值和 t 值的含义是什么?但是,大值是否说明了什么?较大的值是否会为原假设提供更大的支持?如果我将拒绝区域设置为,那么如果我得到会有所不同吗?(毕竟是任意的,而ppp<0.05p0.060.990.050.06非常接近被拒绝,如果我将任意设置为,则原假设将被拒绝。)可以对非拒绝值进行任何统计使用吗?0.050.1p

3个回答

您应该如何“使用” p 值取决于您如何设计与您将运行的分析相关的研究。我在这里的回答中讨论了关于 p 值的两种不同哲学:何时使用 Fisher 和 Neyman-Pearson 框架? 你可能会发现阅读它很有帮助。例如,如果您进行了功效分析并打算使用 p 值做出最终决定,则不应将接近线(“边际显着”)用作有意义的类别。使用与0.05不同的 alpha 0.05(例如0.10)是可以的,但是一旦你决定使用它并相应地设置你的研究,你应该坚持下去。

此外,您不能使用较大的 p 值作为原假设的证据。我在这里的回答中讨论了这个想法:为什么统计学家说一个不显着的结果意味着“你不能拒绝零”而不是接受零假设? 阅读该答案也可能对您有所帮助。

在我看来,一切都归结为假设,即模型与它们的拟合程度。如果它确实同意所有这些,则将 p 值视为概率。然后,您可以通过得出两者中哪一个更有可能来比较 0.06 和 0.99 的 p 值。此外,很大程度上取决于情况:在某些情况下,不应忽略边际重要性,因为正如您所说,拒绝区域可以随意设置。但是,如果模型满足假设,那么你不应该试图在某个任意水平上拒绝你的假设,而是调查你得到的结果的可能性有多大。

确实,假设检验的 p 值的接受范围是相当随意的,但是较低的 p 值意味着可以更确定地接受测试结果,因为 p 值本质上定义了置信区间估计,因此更窄的置信区间应该被认为对测试更重要。