我对使用逻辑回归有些陌生,并且对我对以下值的解释之间的差异感到有些困惑,我认为这些值是相同的:
- 指数化的贝塔值
- 使用 beta 值预测结果的概率。
这是我正在使用的模型的简化版本,其中营养不足和保险都是二元的,财富是连续的:
Under.Nutrition ~ insurance + wealth
我的(实际)模型为保险返回 0.8 的指数 beta 值,我将其解释为:
“投保人营养不良的概率是未投保人营养不良概率的 0.8 倍。”
然而,当我通过将 0 和 1 的值代入保险变量和财富的平均值来计算个人概率差异时,营养不足的差异仅为 0.04。计算如下:
Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
(1+exp(β0 + β1*Insurance + β2*wealth))
如果有人能解释为什么这些值不同,以及更好的解释(尤其是第二个值)可能是什么,我将不胜感激。
进一步澄清编辑
据我了解,未投保人(其中 B1 对应于保险)营养不足的概率为:
Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
(1+exp(β0 + β1*0+ β2*wealth))
虽然被保险人营养不良的概率为:
Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
(1+exp(β0 + β1*1+ β2*wealth))
与投保人相比,未投保人营养不良的几率为:
exp(B1)
有没有办法在这些值之间进行转换(数学上)?我仍然对这个等式有点困惑(我可能应该是 RHS 上的不同值):
Prob(Ins) - Prob(Unins) != exp(B)
用外行的话来说,问题是为什么投保个人不会像赔率比所表明的那样改变他们营养不良的可能性?在我的数据中,Prob(Ins) - Prob(Unins) = .04,其中指数 beta 值为 0.8(那么为什么差异不是 0.2?)