绘制和解释序数逻辑回归

机器算法验证 r 回归 物流 解释 有序的logit
2022-02-15 13:11:42

我有一个序数因变量,容易,范围从 1(不容易)到 5(非常容易)。独立因素值的增加与容易度等级的增加有关。

我的两个自变量 (condAcondB) 是分类的,每个都有 2 个级别,并且 2 ( abilityA, abilityB) 是连续的。

我在 R 中使用ordinal包,它使用我认为的

logit(p(Yg))=lnp(Yg)p(Y>g)=β0g(β1X1++βpXp)(g=1,,k1)

(来自@caracal's answer here

我一直在独立学习这一点,并且会感谢任何可能的帮助,因为我仍在努力解决它。除了序号包附带的教程之外,我还发现以下内容很有帮助:

但我试图解释结果,并将不同的资源放在一起,但我遇到了困难。

  1. 我已经阅读了许多不同的解释,包括抽象的和应用的,但我仍然很难理解这句话的含义:

    随着 condB 增加 1 个单位(即,从分类预测变量的一个级别更改为下一个级别),观察到 Y = 5 与 Y = 1 到 4 的预测几率(以及观察到 Y = 4 与Y = 1 到 3) 变化一个因子 exp(beta),对于图表来说,它是 exp(0.457) = 1.58。

    一种。这对于分类自变量与连续自变量是否不同?
    湾。我的部分困难可能在于累积赔率的想法和那些比较。... 公平地说,从 condA = 缺席(参考水平)到 condA = 存在是 1.58 倍的可能性被评为更高的容易程度?我很确定这是不正确的,但我不确定如何正确陈述它。

从图形上看,
1. 实现这篇文章中的代码,我很困惑为什么得到的“概率”值如此之大。
2.这篇文章中 p (Y = g) 的图对我来说最有意义……它解释了在特定 X 值下观察到特定类别 Y 的概率。我试图得到的原因图表首先是为了更好地理解整体结果。

这是我的模型的输出:

m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID), 
              data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation

formula: 
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) +  (1 | ID)
data:    d

link  threshold nobs logLik  AIC    niter     max.grad
logit flexible  366  -468.44 956.88 729(3615) 4.36e-04
cond.H 
4.5e+01

Random effects:
 Groups  Name        Variance Std.Dev.
 ID      (Intercept) 2.90     1.70    
 content  (Intercept) 0.24     0.49    
Number of groups:  ID 92,  content 4 

Coefficients:
                Estimate Std. Error z value Pr(>|z|)    
condA              0.681      0.213    3.20   0.0014 ** 
condB              0.457      0.211    2.17   0.0303 *  
abilityA           1.148      0.255    4.51  6.5e-06 ***
abilityB           0.577      0.247    2.34   0.0195 *  

Threshold coefficients:
    Estimate Std. Error z value
1|2   -3.500      0.438   -7.99
2|3   -1.545      0.378   -4.08
3|4    0.193      0.366    0.53
4|5    2.121      0.385    5.50
1个回答

我的回归建模策略课程笔记有两章关于序数回归可能会有所帮助。另请参阅教程。

课程笔记详细介绍了模型假设的含义、如何检查它们以及如何解释拟合模型。