我有一个序数因变量,容易,范围从 1(不容易)到 5(非常容易)。独立因素值的增加与容易度等级的增加有关。
我的两个自变量 (condA
和condB
) 是分类的,每个都有 2 个级别,并且 2 ( abilityA
, abilityB
) 是连续的。
我在 R 中使用ordinal包,它使用我认为的
(来自@caracal's answer here)
我一直在独立学习这一点,并且会感谢任何可能的帮助,因为我仍在努力解决它。除了序号包附带的教程之外,我还发现以下内容很有帮助:
但我试图解释结果,并将不同的资源放在一起,但我遇到了困难。
我已经阅读了许多不同的解释,包括抽象的和应用的,但我仍然很难理解这句话的含义:
随着 condB 增加 1 个单位(即,从分类预测变量的一个级别更改为下一个级别),观察到 Y = 5 与 Y = 1 到 4 的预测几率(以及观察到 Y = 4 与Y = 1 到 3) 变化一个因子 exp(beta),对于图表来说,它是 exp(0.457) = 1.58。
一种。这对于分类自变量与连续自变量是否不同?
湾。我的部分困难可能在于累积赔率的想法和那些比较。... 公平地说,从 condA = 缺席(参考水平)到 condA = 存在是 1.58 倍的可能性被评为更高的容易程度?我很确定这是不正确的,但我不确定如何正确陈述它。
从图形上看,
1. 实现这篇文章中的代码,我很困惑为什么得到的“概率”值如此之大。
2.这篇文章中 p (Y = g) 的图对我来说最有意义……它解释了在特定 X 值下观察到特定类别 Y 的概率。我试图得到的原因图表首先是为了更好地理解整体结果。
这是我的模型的输出:
m1c2 <- clmm (easiness ~ condA + condB + abilityA + abilityB + (1|content) + (1|ID),
data = d, na.action = na.omit)
summary(m1c2)
Cumulative Link Mixed Model fitted with the Laplace approximation
formula:
easiness ~ illus2 + dx2 + abilEM_obli + valueEM_obli + (1 | content) + (1 | ID)
data: d
link threshold nobs logLik AIC niter max.grad
logit flexible 366 -468.44 956.88 729(3615) 4.36e-04
cond.H
4.5e+01
Random effects:
Groups Name Variance Std.Dev.
ID (Intercept) 2.90 1.70
content (Intercept) 0.24 0.49
Number of groups: ID 92, content 4
Coefficients:
Estimate Std. Error z value Pr(>|z|)
condA 0.681 0.213 3.20 0.0014 **
condB 0.457 0.211 2.17 0.0303 *
abilityA 1.148 0.255 4.51 6.5e-06 ***
abilityB 0.577 0.247 2.34 0.0195 *
Threshold coefficients:
Estimate Std. Error z value
1|2 -3.500 0.438 -7.99
2|3 -1.545 0.378 -4.08
3|4 0.193 0.366 0.53
4|5 2.121 0.385 5.50