当原假设是复合的时,p 值是否仍然均匀分布?

机器算法验证 假设检验 p 值
2022-03-30 23:25:27

当原假设很简单(即只有样本的分布)并且样本的唯一分布是连续的时,可以证明 p 值在 (0,1) 上均匀分布。

当原假设是复合的(即有多个样本分布)时,p 值是否仍然均匀分布在 (0,1) 上?为什么?

2个回答

答案似乎是“不”,但有时“是的,渐近地,取决于 p 的构造”。Robins、van der Vaart 和 Ventura (2000)详细介绍了细节。

推理基本上是@whuber 在评论中以电报形式表示的。自然状态对有害参数很重要。

首先让我们处理单点假设。人们经常声称(就像目前在维基百科中一样)p 值在 [0,1] 上是一致的。

这显然不是离散结果的情况。例如,如果一枚硬币被抛 5 次,并且测试统计量是获得正面的数量,那么在硬币是公平的零假设下,只有 3 个可能的p值。p值 0.0625、0.375 和 1 的概率分别为 0.0625、0.3125 和 0.625,由结果 {0,5}、{1,4} 和 {2,3} 引起

也许不太明显的是,连续情况并不总是如此。考虑一个零假设,即当电池耗尽时分针在我的时钟上的位置均匀分布在 [0,60) 范围内。所有结果都具有相同的发生概率,因此获得与观察到的结果一样极端或更极端的结果的概率是统一的。

继续讨论复合空值。不,对于复合空值,p 值不分布在 (0,1) 上,而不仅仅是因为上面给出的原因。也许p值对于复合空值根本没有意义。

或者,p值被认为是观察数据的复合空值的最有利成员的p值,即空值的最大似然成员。在这种解释下,p值为零可能是不可能的。考虑硬币是公平的零假设,其中公平被定义为具有一点容差,因此 0.49 < p < 0.51。如果观察到零正面,最可能的点假设是 p=0.49。但是使用 null 的这个成员会有更极端的结果:在这种情况下,所有正面的可能性都会更小。因此p值有一个不为 0的下限。

请注意,考虑给定数据集的不利的空值成员不会让您有任何帮助 - 对于某些复合假设,无论数据如何,始终可以选择观察数据的概率为零的空值成员可能是(因此是一个始终为零的p值)。一个例子是硬币有偏差的零值,其中偏差定义为上述范围之外,即 p<0.49 或 p>0.51。如果观察到一些正面,则点假设 p=0 使这不可能。相反,如果没有获得正面,则 p=1 会使这不可能。因此p值不能根据 null 的最不利成员来定义。