Fisher 精确检验是否适用于2 × 22×2表使用非中心超几何分布还是超几何分布?

机器算法验证 假设检验 卡方检验 术语 列联表 渔民精确测试
2022-04-12 02:25:39

在进行Fisher精确检验时,在维基百科上它指出p值是计算为概率小于或等于观察表概率的表的概率之和。然后它指出我们使用超几何分布来找到概率。但是,在 R 中,文档声明使用了非中心超几何分布。为什么两者有区别?谢谢!

3个回答

这就是 R 帮助所说的。

对于 2 x 2 表,条件独立的空值等同于优势比等于 1 的假设。“精确”推断可以基于观察到,一般而言,在所有边际总数固定的情况下,列联表的第一个元素具有非中心超几何分布,其非中心参数由优势比给出(Fisher,1935 年)。

所以请注意那句话中的两个事实:

  • 条件*独立的零点等价于优势比等于 1 的假设

  • 列联表的第一个元素具有非中心超几何分布,其非中心参数由优势比给出

如果您将优势比设为 1,那么这就是中心超几何。例如,参见关于Fisher 的非中心超几何分布的 Wikipedia 文章,其中明确说明了这一点:

当优势比为 1 时,这两个分布*都等于(中心)超几何分布。

* [Fisher 和 Wallenius 的非中心超几何正在讨论中;当优势比为 1 时,它们都给出了普通的超几何]

所以没有矛盾 - 在零点下,它是中心超几何。

为什么 R 帮助没有添加几句话来说明这一点,我不知道。

--

* 这是以那里为条件的边距

非中心超几何分布是超几何分布的推广。后者用于Fisher 精确检验然而,它似乎经常被称为超几何分布,就好像不存在非中心性问题一样。我想对此的想法是,非中心性只是为超几何分布引入权重,人们有时使用速记并通过函数名称本身来引用加权函数,例如,当权重是中性时,就是这样功能。

@gammer 有用地表明差异相当于超几何情况的独立随机变量,以及非独立随机变量情况的加权(非中心)超几何分布。顺便说一句,(+1)好问题。

但是请注意,这不是Fisher精确检验类型问题的唯一数值方法,请参阅鉴于当今计算机的能力,是否有理由进行卡方检验而不是Fisher精确检验?了解更多信息。

正如@Glen_b 所说,在优势比为 1 的零假设下,Fisher 的非中心超几何分布简化为超几何分布。然而fisher.test,除了执行 Fisher 精确检验之外,该函数 (1) 还计算优势比的条件最大似然估计值和置信区间, & (2) 确实有一个参数可以将优势比设置为null 为 1 以外的值;解释提出非中心性的必要性。值得注意的是,尽管手册上说“在所有边际总数固定的情况下”,但在这些计算中使用的是费舍尔非中心超几何分布;这可能是由于在几种抽样方案下对边际总量的调节而产生的,但是当它们实际上是通过设计固定时,这是不适用的。雾(2015),“有偏见的瓮理论”