逻辑回归:解释连续变量

机器算法验证 回归 物流
2022-03-27 02:10:20

我有几个关于解释逻辑回归中连续变量的优势比的问题。我觉得这些是关于逻辑回归的基本问题(也可能是关于一般回归的问题),虽然我对我不知道答案感到有点羞愧,但我会忍住我的自豪感并问他们,这样我就知道了未来!

这是我的情况...我正在查看一个经过裁决的青年样本,他们作为缓刑的一部分参加了工作/生活技能培训计划。我想看看他们从计划中释放的年龄在多大程度上预测了从计划释放后六个月的就业。

(另外,请记住,模型中还有其他预测变量,但我已将它们排除在外,因为它们在统计上不显着,我希望尽可能清楚地说明这一点。)

预测变量:培训计划的释放年龄(平均年龄 = 17.4,SD=1.2,范围 14.3-20.5)

结果:就业与否(就业=1,未就业=0)

结果:优势比 3.01 (p<.005)(我已排除拟合优度等统计数据,因为我只寻求关于优势比解释的答案;我对模型拟合的评估感到满意,CI 的, ETC。)

一句话:随着年龄增加一岁,出院后六个月就业的几率增加三个单位。

问题:

1)当我说“随着年龄增加一岁......”时,年龄的起点是什么?

年龄是从零开始的吗?例如,“随着年龄从 0 开始增加 [即,如果您将此模型放在图表上的最低年龄]...”

年龄是否从样本年龄范围中的最低年龄开始?例如,“随着年龄从 14.3 岁开始增加……”

或者

年龄是否从样本的平均年龄开始?例如,“随着年龄从 17.4 岁开始增加……”,

2)居中会帮助我解释这个结果还是只对解释 y-int 有效?如果有帮助,我正在考虑进行平均居中或从样本中的所有其他年龄中减去该范围内的最低年龄。有什么建议么?

3) 最后,是否可以说,与 14 岁的青年相比,17 岁的青年就业的可能性是 9 倍?我问是因为我知道逻辑回归假设一个 sigmoid 关系,我很好奇这 3 个单位的几率增加是否在回归线的任何点上保持一致。

非常感谢!

亚伦

2个回答

1)因为它是一个优势,所以你从哪里开始并不重要。18 岁的几率是 17 岁的 3 倍。或者 17 岁的几率是 18 岁的 1/3。一样。如果您想获得特定年龄的人将被雇用的概率,您可以使用带有参数估计值的公式(而不是 OR)。或者你可以得到你正在使用的程序来为你做这件事。

2)居中是否有帮助是一个见仁见智的问题。我没有发现居中的模型更清晰,但有些人这样做。

3) 赔率与“可能”并不完全相同(尽管许多人说得好像是一样),17 岁的赔率是 14 岁的 27 倍。

最后,我会对这个模型保持谨慎。该模型假设 OR 在 14 和 15、15 和 16 等之间是相同的。根据我对该主题的了解,这对我来说似乎不太可能。

在保持所有其他变量不变后,一个人参加培训问题的平均几率是另一个比他年轻/年长一岁的人的几率的 # 倍。

这是我的看法。