在假设检验中,p 值的定义是在假设原假设正确的情况下,获得至少与实际观察到的结果一样极端的检验结果的概率。
现在,我对“极端”含义的理解基于@whuber在统计测试中 p 值和 t 值的含义是什么?. 他们指出,“更极端”的值是指 x 值,在该值处,x 处的似然比(零下的似然与替代下的似然之比)大于为检验统计量观察到的特定值的似然比.
对于单方面的假设检验,这种“极端”的定义对我来说是有意义的。但是,在考虑双面测试时,我仍然不确定如何找到“更极端”的值。让我用一个例子来说明。
假设我们抛硬币 10 次,假设每次抛硬币正面朝上的概率是 p。让和。假设我们的检验统计量是正面的总数,在原假设下应该遵循二项式 (10,0.3) 分布。假设我们观察到 5 个正面。我明白为什么在计算 p 值时,我们需要包括获得至少 5 个正面的概率,因为 x=5,6,7,...,10 处的似然比都大于或等于似然比为 5。
现在,我周围的人告诉我,x=0 和 x=1 也被认为至少与 x=5 一样极端。所以这是我的问题:为什么 x=0 和 1 的值被认为与 5 一样极端?我似乎无法使用“极值”的似然比定义来理解为什么 0 和 1 被认为与 5 一样极端。任何帮助将不胜感激。如果您不想使用@whuber 的极端定义,那很好,但请说明您对极端的定义。
