Fisher-exact 检验的解释

机器算法验证 r 解释 优势比 渔民精确测试
2022-03-04 09:21:17

我正在运行一些R代码,我想检查一些数据是否独立。我可以使用拒绝独立性的卡方检验。但是我想使用 Fisher-exact 检验。再一次,p < 0.001但我应该如何解释这个优势比?

该表由男性0与女性1以及超重1与不超重组成0

> table(nhefs.adjust.nNA$overweight,
+       nhefs.adjust.nNA$sex,
+       dnn = c("overweight","sex"))
          sex
overweight   0   1
         0 407 535
         1 419 295
> fisher.test(table(nhefs.adjust.nNA$overweight,
+                   nhefs.adjust.nNA$sex,
+                   dnn = c("overweight","sex")))

Fisher's Exact Test for Count Data

data:  
p-value = 5.145e-10
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.4376387 0.6554322
sample estimates:
odds ratio 
 0.5358085 

回应 Aaron Zeng 的回答

          death
overweight   Y   N
         Y 156 558
         N 165 777

odds ratio 
  1.316281 

那么这是否应该被解释为:

超重的人的死亡几率比没有超重的人高出 32% 左右?

这似乎有点奇怪,因为 156 与 165 似乎意味着风险较小?

2个回答

默认情况下,R 中的 Fisher 精确检验测试与第一个单元格相关的优势比是否为 1。

也就是说,您可以将优势比 0.53 解释为:非体重过重的受试者成为男性的几率是体重过重的受试者的 0.53 倍。请注意,p 值显着且置信区间不包含 1。因此,您拒绝优势比为 1 的原假设。

但是,您可能希望交换 2×2 列联表的列和行,以便您可以将“性别”解释为解释变量,将“是否超重”解释为响应,这似乎更自然。在这种情况下,优势比的估计值仍应为 0.53。但你可以更自然地理解为:男性不超重的几率是女性的 0.53 倍。

优势比是衡量 2x2 表格距离独立性有多远的指标。

在您的问题中,优势比是 P(overweight|female)/(1-P(overweight|female))(女性超重的几率)除以 P(overweight|male)/(1-P(overweight|male) )(男性超重的几率)。作为两组赔率的比率,它被称为赔率比。

如果该表是从一个因子独立的总体中得出的,那么这两个总体优势将相等,因此总体优势比将为 1(或对数优势比将为 0)。

最常见的优势比估计值是通过用样本比例替换概率来获得的(这简化了将计数交叉乘以并将对角乘积除以非对角乘积,或表中的),它在你的数字上给出 0.5356,但这不是对应于 Fisher 精确检验的估计量。这使用给定表格边缘的优势比的 MLE(就像表格边缘上的 Fisher 测试条件一样)。在您的情况下,它给出了 0.5358 的稍大估计值。ad/bcabcd

因此,这个特定的优势比提供了一种方法来估计您的表格与独立性有多远,或多或少对应于 Fisher 精确检验(它的间隔是否包括 1 不能保证与检验结果相对应,但它们通常会去一起)。