Fisher精确检验中的检验统计量是什么?

机器算法验证 假设检验 渔民精确测试 超几何分布
2022-03-08 05:00:53

对于 2×2 列联表,有人说Fisher 精确检验使用表中 (1,1) 单元格中的计数作为检验统计量,在零假设下,将具有超几何分布。X1,1X1,1

有人说它的检验统计量是 其中是 null 下超几何分布(上面提到的)的平均值。它还说p值是根据超高分布表确定的。我想知道是否有理由减去平均值然后取绝对值?在 null 下没有超几何分布,是吗?

|X1,1μ|
μ|X1,1μ|

3个回答

(为了使我们的概念更准确一点,我们将“检验统计量”称为我们查找以实际计算 p 值的事物的分布。这意味着对于双尾 t 检验,我们的检验统计量将是而不是|T|T

检验统计量的作用是对样本空间进行排序(或更严格地说,是部分排序),以便您可以识别极端情况(与备选方案最一致的情况)。

在 Fisher 精确检验的情况下,在某种意义上已经存在排序 - 这是各种 2x2 表本身的概率。碰巧的是,它们对应于的最大值或最小值都是“极端”的,它们也是概率最小的值。因此,与其的值,不如简单地从大端和小端开始工作,在每一步只需添加任何值(最大或最小X1,1X1,1X1,1X1,1-value not already in there) 具有与之相关的最小概率,一直持续到您到达观察到的表;包含在内,所有这些极端表的总概率就是 p 值。

这是一个例子:

超几何概率函数

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

第一列是值,第二列是概率,第三列是诱导排序。X1,1

所以在Fisher精确检验的特殊情况下,每个表(等效地,每个值)的概率可以被认为是实际的检验统计量X1,1

如果您比较建议的检验统计量,在这种情况下它会产生相同的排序(我相信它通常会这样做,但我没有检查过),因为该统计量的较大值是概率的较小值,因此它同样可以被视为“统计量” - 但许多其他量也可以 - 实际上,在所有情况下保持的这种排序的任何量都是等效的测试统计量,因为它们总是产生相同的 p 值。|X1,1μ|X1,1

还要注意,在开始时引入了更精确的“测试统计”概念,这个问题的所有可能的测试统计实际上都没有超几何分布;确实如此,但它实际上不是双尾检验的合适检验统计量(如果我们进行单边检验,其中只有主对角线中的更多关联而不是第二对角线中的关联被认为与替代方案,那么它将是一个检验统计量)。这与我开始时的单尾/双尾问题相同。X1,1

[编辑:一些程序确实提供了 Fisher 检验的检验统计量;我认为这将是一个 -2logL 类型的计算,可以与卡方渐近比较。有些人可能还会显示赔率比或其对数,但这并不完全等价。]

|X1,1μ|一般不能有超几何分布,因为不需要是整数值,然后不会是整数。但在边缘条件下,将具有超几何分布。μ|X1,1μ|X1,1

如果您正确执行并将边距固定为已知值,则可以将(或任何其他单元格)视为您的统计数据。个白球和个黑球的瓮中个球而不放回的类比可以解释为抽出的白球个数,其中是第一行的总和,是第二行的总和,是第一列的总和。X1,1kWBX1,1BWk

它真的没有。测试统计是一个历史异常 - 我们拥有测试统计的唯一原因是获得 p 值。费舍尔精确检验跳过检验统计量并直接达到 p 值。