机器算法验证 - p 值的微妙之处：更大等于与更大 - 吾爱随笔录

当我阅读 Wassermann 的《所有统计》一书时，我注意到 p 值的定义中有一个微妙之处，我无法理解。非正式地，Wassermann 将 p 值定义为

[..]观察到检验统计量值与实际观察到的值相同或更极端的概率（在下）。 $H_0$

重点补充。更正式的相同（定理 10.12）：

假设大小测试的形式为 $\alpha$

拒绝当且仅当。 $H_0$ $T(X^n) \ge c_\alpha$

然后，

$p -value = sup_{θ \in Θ_{0}} P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = \sup_{\theta\in\Theta_0} P_{\theta_0}[T(X^n) \ge T (x^n)]$

其中 $x^n$ 是 $X^n$ 的观察值。如果 $\Theta_0=\{\theta_0\}$ 那么
$p -value = P_{θ_{0}} [T (X^{n}) \geq T (x^{n})]$ $\text{$p$-value} = P_{\theta_0}[T(X^n) \ge T (x^n)]$

此外，Wassermann 将 Pearson 的 $\chi^2$ 检验（以及其他类似检验）的 p 值定义为：

p -value = P [χ_{k - 1}^{2} > T] .

$\text{$p$-value} = P[\chi^2_{k-1} > T].$

我想要求澄清的部分是第一个定义中的更大等号（ $\ge$ ）和第二个定义中的更大（ $>$ ）符号。我们为什么不写 $\ge T$ ，它会匹配“相同或更极端”的第一个引号？

这纯粹是为了方便我们将 p 值计算为 $1-F(T)$ 吗？我注意到 R 也使用带有 $>$ 符号的定义，例如 in chisq.test。