p值是点估计吗?

机器算法验证 置信区间 估计 p 值 估计者 点估计
2022-02-11 21:26:13

由于可以计算 p 值的置信区间,并且与区间估计相反的是点估计:p 值是点估计吗?

3个回答

点估计和置信区间用于描述分布的参数,例如均值或标准差。

但与其他样本统计数据(如样本均值和样本标准差)不同,p 值不是有趣分布参数的有用估计量。查看@whuber 的答案以了解技术细节。

检验统计量的 p 值给出了观察到与检验统计量的预期值的偏差与在样本中观察到的偏差最小的概率,该概率是在原假设为真的假设下计算的。如果你有整个分布,它要么与原假设一致,要么不符合。这可以用指标变量来描述(再次,请参阅@whuber 的答案)。

但是 p 值不能用作指示变量的有用估计量,因为它不一致,因为如果原假设为真,p 值不会随着样本量的增加而收敛。这是一种相当复杂的替代方式,它表明统计测试可以拒绝或无法拒绝空值,但从不确认它。

是的,它可能(并且已经)认为 p 值是一个点估计。

为了确定 p 值可能估计的分布的任何属性,我们必须假设它是渐近无偏的。但是,渐近地,零假设的平均 p 值为(理想情况下;对于某些测试,它可能是其他非零数),对于任何其他假设,它是因此,p 值可以被认为是原假设指示函数的二分之一的估计量。1/20


诚然,以这种方式查看 p 值需要一些创造力。通过将所讨论的估计量视为我们通过 p 值做出的决定,我们可以做得更好:基础分布是原假设的成员还是备择假设的成员?我们称这组可能的决策为杰克基弗写道D

我们假设有一个实验,其结果统计学家可以观察到。该结果由随机变量或随机向量 ... 描述。的概率定律,但已知指定类的分布函数的成员。...XXFXΩ

如果的某个实数或向量值属性的可能值的集合,该属性以合理平滑的方式依赖于 ,则统计问题被称为点估计问题。DFF

在这种情况下,因为是离散的,所以“合理平滑”根本不是限制。Kiefer 的术语通过将具有离散决策空间的统计过程称为“测试”而不是“点估计器”来反映这一点。D

虽然探索这些定义的限制(和限制)很有趣,正如这个问题邀请我们做的那样,也许我们不应该太强烈地坚持 p 值是点估计量,因为估计量和测试之间的这种区别是有用的和常规的。


在对这个问题的评论中,Christian Robert 引起了人们对 1992 年论文的关注,他和合著者正是在该论文中采取了这一观点,并分析了 p 值作为指标函数估计量的可接受性。请参阅下面参考资料中的链接。论文开始,

假设检验的方法通常将检验问题视为决策而非估计问题之一。更准确地说,正式的假设检验将得出关于假设是否正确的结论,而不是提供与该结论相关联的证据量度。在本文中,我们将假设检验视为决策理论框架内的估计问题......

[强调补充。]


参考

Jiunn Tzon Hwang、George Casella、Christian Robert、Martin T. Wells 和 Roger H. Farrell,《测试准确度的估计》安。统计学家。第 20 卷,第 1 期(1992 年),490-509。 开放存取

Jack Carl Kiefer,统计推断导论施普林格出版社,1987 年。

p-值用于估计任何感兴趣的参数,而是用于假设检验。例如,您可能对估计人口感兴趣μ基于您拥有的样本,或者您可能对它的区间估计感兴趣,但在假设检验场景中,您宁愿比较样本均值x¯人口平均数μ看看它们是否不同。事实上,在假设检验场景中,您对它们的特定值感兴趣,而是如果它们低于某个阈值(例如p<0.05)。p-values 你对它们的点值不是很感兴趣,而是你想知道你的数据是否提供了足够的证据来反对零假设。在假设检验场景中,您不会比较不同的p-values,而是使用它们中的每一个来对您的假设做出单独的决定。你真的不想知道关于船体假设的任何事情,只要你知道你是否可以拒绝它。这使得它们的值与决策上下文密不可分,因此它们与点估计不同,因为通过点估计,我们对它们的值本身感兴趣。