我将主要关注你的前三个问题。简短的回答是:(1)您需要比较每个时间段的 IV 对 DV 的影响,但是(2)仅比较幅度会导致错误的结论,并且(3)有很多方法可以做到这一点,但哪个是正确的没有共识。
下面我描述了为什么你不能简单地比较系数大小并指出一些迄今为止已经想到的解决方案。
根据 Allison (1999),与 OLS 不同,逻辑回归系数会受到未观察到的异质性的影响,即使这种异质性与感兴趣的变量无关。
当您拟合逻辑回归时,例如:
(1)
ln(11−pi)=β0+β1x1i
您实际上是在拟合一个预测潜在变量值的方程y∗表示每个观察值的潜在倾向1在二元因变量中,如果y∗高于某个阈值。等式是(Williams,2009):
(2)
y∗=α0+α1x1i+σε
术语ε假设独立于其他项并遵循逻辑分布 - 或在 probit 的情况下为正态分布,在互补对数对数的情况下为对数逻辑分布,在 cauchit 的情况下为柯西分布。
根据威廉姆斯(2009)的说法,α等式 2 中的系数与β等式 1 中的系数通过:
(3)
βj=αjσj=1,...,J.
在等式 2 和 3 中,σ是未观察到的变化的比例因子,我们可以看到估计的大小β系数取决于σ,这是没有观察到的。基于此,Allison (1999)、Williams (2009) 和 Mood (2009) 等人声称,您不能天真地比较不同组、国家或时期估计的逻辑模型之间的系数。
这是因为如果未观察到的变化在组、国家或时期之间存在差异,则比较可能会得出错误的结论。使用不同模型和在同一模型中使用交互项的比较都存在这个问题。除了 logit,这也适用于它的表亲 probit、clog-log、cauchit,并且通过扩展,也适用于使用这些链接函数估计的离散时间风险模型。有序 logit 模型也受其影响。
Williams (2009) 认为,解决方案是通过异构选择模型(又名位置尺度模型)对未观察到的变化进行建模,并提供了一个oglm
为此要求的 Stata 插件(Williams 2010)。在 R 中,异构选择模型可以与包的hetglm()
功能相匹配glmx
,这可以通过 CRAN 获得。这两个程序都非常易于使用。最后,Williams (2009) 提到了 SPSSPLUM
用于拟合这些模型的例程,但我从未使用过它,也无法评论它的易用性。
但是,至少有一篇工作论文表明,如果方差方程指定错误或存在测量误差,则使用异质选择模型进行的比较可能会更加偏颇。
Mood (2010) 列出了其他不涉及对方差建模,但使用预测概率变化比较的解决方案。
显然这是一个尚未解决的问题,我经常在我所在领域(社会学)的会议上看到论文提出不同的解决方案。我建议你看看你所在领域的人做什么,然后决定如何处理它。
参考