对二元逻辑回归模型中优势比估计值大小的担忧

机器算法验证 回归 物流 优势比 二进制数据
2022-04-06 22:32:12

我正在创建一些二元回归,并且想知道我是否应该对优势比的大小感到惊讶。

在此特定示例中,因变量指示学生是否可以达到第二语言的指定目标。解释变量是作为连续协变量的年龄和母语读写能力的量度。我正在使用 SPSS 来计算模型,它们似乎工作正常(我有一个大约 40,000 个案例的大型数据集,数据中的空单元格很少,没有警告标志等)我选择了 0 作为参考结果和分类解释变量的类别。据我了解,我在下面看到的估计告诉我,如果学生在 4 级展示 L1 阅读,他们能够展示第二语言所需技能的可能性是 372 倍。

估计的模式与我预期的完全一样,我的问题是我是否应该关注估计的大小,或者在两个变量之间明显存在密切联系的情况下这是否常见。

非常感谢!

知识库

> Parameter          B         Exp(B)
> 
> (Intercept)      -3.077    
> Age                .075        1.078 
> [L1 Reading=4]    5.921      372.784 
> [L1 Reading=3]    5.330      206.438 
> [L1 Reading=2]    4.288       72.821 
> [L1 Reading=1]    3.025       20.594
> [L1 Reading=0]        0            0

L1 和 DV 的交叉表:

+-------+-------+-------+------+------+-------+-------+
|       |     0 |     1 |    2 |    3 |     4 |  Total|
| 0.00  | 17537 |  6487 |  784 |  100 | 44    | 24952 |
| 1.00  |  1284 |  9891 | 4287 | 1576 | 1328  | 18366 |
| Total | 18821 | 16378 | 5071 | 1676 | 1372  | 43318 |
+-------+-------+-------+------+------+-------+-------+
2个回答

感谢您添加表格

鉴于此,我认为 OR 很好。您发布的逻辑回归还包括另一个变量,但在表中,L1 = 4 与 L1 = 0 的 OR 为,实际上比一个来自回归。175371328128444=412.23

这是一种非常牢固的关系。

彼得的好答案需要补充一点:

372 倍的可能性

绝对是不正确的,尽管您将是犯此错误的第 10 亿人。接近 400 的数字不是两个概率的比值,而是两个几率的比值。两个对应概率之比为 [1328/(1328+44)] / [1284/(1284+17537)] = .968/.068 = 14

人们可以用“风险”甚至“机会”或“可能性”来代替“概率”,但用上述任何一个代替“几率”是不正确的。