统计控制如何在逻辑回归中发挥作用?

机器算法验证 物流 多重回归 控制变量
2022-04-04 20:15:57

我想确保我通常可以准确地解释模型发现。公平地说,与预测变量相关的每个对数赔率都假设其他对数赔率保持在 0 不变?使其类似于标准线性回归。这种变化会基于连续预测变量还是二元预测变量?

2个回答

公平地说,与预测变量相关的每个对数赔率都假设其他对数赔率保持在 0 不变?

logit模型是

E(Yt|xt)=ptlog(pt1pt)=βxt

所以βj描述了在对数赔率尺度上的单位移动j只要其他协变量保持固定,则无论其他协变量是否为零,协变量。

这种变化会基于连续预测变量还是二元预测变量?

不,这不会改变任何事情。

即使在标准线性回归中,预测变量的系数也表示当所有其他预测变量保持不变时结果变量与该特定预测变量的关联。不要求它们保持为 0 值;只要其他保持不变,在线性模型的假设下,它们的值是什么都无关紧要。对于基于线性模型的标准回归和逻辑回归都是如此。

然而,截距的解释将根据预测变量的值的编码方式而显着不同。使用 R 中使用的默认处理对比,当连续预测变量的值为 0 且分类变量处于其参考水平时,截距将是结果变量的值。您必须小心截距,因为并非所有统计软件程序都使用相同的默认值来选择分类变量的参考值,并且预测变量对比的不同处理也可能会影响它们。

但是,当您考虑与标准回归和逻辑回归的交互时,事情确实会变得有些棘手。然后,交互项有效地表示交互预测变量值的乘积。对于连续变量,如果您首先将连续预测变量的中心设置为 0 的平均值,则交互系数的解释会更简单。然后,当所有单个预测变量都处于其平均值时,任何此类交互项的值都将为 0。