当我阅读 Wassermann 的《所有统计》一书时,我注意到 p 值的定义中有一个微妙之处,我无法理解。非正式地,Wassermann 将 p 值定义为
[..]观察到检验统计量值与实际观察到的值相同或更极端的概率(在下) 。
重点补充。更正式的相同(定理 10.12):
假设大小测试的形式为
拒绝当且仅当。
然后,
其中是的观察值。如果那么
此外,Wassermann 将 Pearson 的检验(以及其他类似检验)的 p 值定义为:
我想要求澄清的部分是第一个定义中的更大等号()和第二个定义中的更大()符号。我们为什么不写,它会匹配“相同或更极端”的第一个引号?
这纯粹是为了方便我们将 p 值计算为吗?我注意到 R 也使用带有符号的定义,例如 in chisq.test
。