机器算法验证 - 在我的回归模型中计算的优势比似乎太高了 - 吾爱随笔录

在我的回归模型中计算的优势比似乎太高了

机器算法验证 r 物流混合模式优势比

2022-03-25 07:11:33

我进行了一项受试者内实验。实验的 DV 是一个分类变量（0 或 1），IV 具有三个级别（1 = 无，2 = 弱，3 = 强）由于 DV 是二元的，我建立了一个逻辑混合效应回归模型. 这是我在下面运行的代码：

model <- glmer(DV ~ IV + (1|subjects) + (1|items), data=df, family=binomial("logit"))

模型收敛如下：

Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) ['glmerMod']
Family: binomial  ( logit )
Formula: DV ~ IV + (1 | subjects) + (1 | items)
Data: df

AIC      BIC   logLik deviance df.resid 
1370.3   1398.4   -680.2   1360.3     2035 

Scaled residuals: 
   Min      1Q  Median      3Q     Max 
 -9.0454 -0.2655  0.1214  0.2882  7.7130 

 Random effects:
   Groups   Name        Variance Std.Dev.
 items    (Intercept) 1.9754   1.4055  
 subjects (Intercept) 0.4548   0.6744  
 Number of obs: 2040, groups:  items, 60; subjects, 34

 Fixed effects:
              Estimate Std. Error z value             Pr(>|z|)    
   (Intercept)  -3.1913     0.3899  -8.185 0.000000000000000272 ***
   type.strong    6.1598     0.5401  11.405 < 0.0000000000000002 ***
   type.weak      4.2876     0.5046   8.498 < 0.0000000000000002 ***
   ---
   Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

 Correlation of Fixed Effects:
   (Intr) typstr
 typestrong -0.682       
 typeweak   -0.714  0.541

显然，我的模型表明 IV 具有显着效果。但是，当我将固定效应的每个系数转换为优势比时，我认为结果太高了，如下所示。

exp(6.1598) # 473.3334
exp(4.2876) # 72.79156

最初，我预计我提到的那些系数是负数（或至少远小于 6.1598 和 4.2876）。但是当模型显示这些结果时，我强烈怀疑我是否采取了正确的程序。所以，这是我的问题。

固定效应的方向与我模型中的截距相反可以吗？
最重要的是，我计算的优势比是否可用？即我的 IV 可以作为适当的预测器吗？
还是我错过或做错了什么？

这是我第一次运行 IV 具有三个级别的逻辑混合效应模型。任何帮助将不胜感激，在此先感谢！

1个回答

固定效应的方向与我模型中的截距相反可以吗？

是的。截距的解释是，它是组中事件 ( DV = 1) 的对数几率none（因此，为负，这是一种保护作用），而其他两组的估计值是对数几率与该组相比，这些组中的每一个中的事件none（因此是积极的，它们是风险因素）。因此，组内事件的对数几率weak比组内高 4.2876，组内none事件的对数几率strong比组内高 6.1598 none。

最重要的是，我计算的优势比是否可用？即我的 IV 可以作为适当的预测器吗？

是的，但请注意，固定效应取决于随机效应。这意味着在您的情况下，对数赔率 - 或者如果您对它们求幂，则赔率比 - 是针对同一主题和同一项目的，而不是在所有主题和项目中取平均值。如果您想要平均估计值，那么您可以使用该GLMMAdaptive软件包获得那些估计值

还是我错过或做错了什么？

如果没有关于您的研究设计的更多信息，很难说，但如果您担心结果，请注意默认情况下glmer使用拉普拉斯近似，这意味着每个轴只有 1 个点用于评估对数似然的自适应高斯-厄米近似，这会产生带有二元结果的有偏差的结果。尝试设置nAGQ = 2或更高。您还可以尝试使用包中专门为广义线性混合模型中的自适应正交编写的mixed_model函数。GLMMAdaptive

其它你可能感兴趣的问题

上一篇使用“多级”和“lme4”R包的嵌套数据的多级回归模型？下一篇选择哪个pdf作为角度的先验？