Logistic 回归与 Fisher 的精确检验给出了非常不同的结果 - 为什么?

机器算法验证 r 回归 物流 渔民精确测试
2022-04-09 16:56:39

我有一个令人困惑的情况,我从两种分析简单数据的方式中得到了强烈冲突的结果。我测量了每个参与者的两个二元变量,AestheticOnly 和 ChoiceVA。我想知道 AestheticOnly 是否取决于 ChoiceVA 以及这种关系在两个不同的实验中是否不同。这是我的参与者计数数据:

Experiment 1
                 AestheticOnly
                 0   1  All
ChoiceVA A      35   6   41
         V      20  13   33
         All    55  19   74

Experiment 2
                 AestheticOnly
                 0   1  All
ChoiceVA A      12  10   22
         V      31  11   42
         All    43  21   64

我运行了一个逻辑回归,其中 AestheticOnly 由 ChoiceVA、实验和交互建模:

> mod <- glm( AestheticOnly ~ ChoiceVA*Experiment, data = d, family=binomial)
> summary(mod)

Call:
glm(formula = AestheticOnly ~ ChoiceVA * Experiment, family = binomial, 
    data = d)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.1010  -0.7793  -0.5625   1.2557   1.9605  

Coefficients:
                     Estimate Std. Error z value Pr(>|z|)    
(Intercept)           -3.3449     0.9820  -3.406 0.000659 ***
ChoiceVAV              3.5194     1.2630   2.787 0.005327 ** 
Experiment             1.5813     0.6153   2.570 0.010170 *  
ChoiceVAV:Experiment  -2.1866     0.7929  -2.758 0.005820 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 166.16  on 137  degrees of freedom
Residual deviance: 157.01  on 134  degrees of freedom
AIC: 165.01

Number of Fisher Scoring iterations: 4

显然所有因素都很重要。但是,这对我来说毫无意义。例如,查看实验的主要效果应该等同于执行 Fisher's Exact 检验,比较 55 和 19 与 43 和 21(每个表的底部)。这显然不显着(p=.452)。那么为什么回归模型会给出如此不同的结果呢?非常感谢任何帮助。

1个回答

我认为问题在于您试图用相同的模型回答两个问题。Fisher 检验用于粗略优势比,在实验水平上崩溃。逻辑模型不测试粗略 OR。如果在实验层中不满足优势比的同质性,我们不想进行粗略或分层分析。饱和逻辑模型的输出可用于检查这一点。

因为您已将实验级别编码为数字,所以很难解释输出。ChoiceVAV 效应被预测为实验水平为 0。我们必须使用后估计来预测来自饱和逻辑模型的实验的实际、有意义的结果。

要获得实验一的 OR,您必须添加 ChoiceVAV 和 ChoiceVAV:实验:3.52 - 2.19 = 1.33 = log(35*13 /(20*6))。最后一个表达式是第一个实验的特定层或表达式。

第二个实验具有特定于层的 OR 3.52 - 2*2.19 = -0.86 = log(12*11 /(10*31))。这些是相反的迹象。因此违反了 OR 的同质性。粗略的 OR 并不完全(但接近)对这些 OR 的加权平均值的检验。您可以清楚地看到它们的平均值约为 0。粗略的 OR 验证了这一点。

总之,这两个实验产生了大量相互矛盾的结果,不应将其合并为单一分析。这是过度关注统计显着性的问题。FET 并不重要,这正是预期的结果。