多项逻辑回归的替代方案

机器算法验证 物流 分类数据 模型选择 多项分布
2022-03-07 06:53:00

我一直在使用多项逻辑回归来检查学校选择的相关性。因变量有三种可能:公立学校、私立学校和NGO(非政府组织,即非营利)学校。但是,我很确定这个问题违反了不相关替代 (IIA) 假设的独立性——无论是出于直觉(例如,删除 NGO 选项会增加去政府和私立学校的可能性)和使用suest命令在 Stata 中进行 Hausman 测试(不是 100% 确定我这样做是正确的,但这是另一个问题)。

无论如何,问题是,如果多项式 logit 不是最好的模型,那么我还能尝试什么?由于只有三个选项,我可以简单地使用两个单独的 logits(例如 NGO 与其他和私人与其他)还是不合适?据我了解,其他多项式方法会带来自己的问题,例如 Invariant Proportion of Substitution 属性(如此处所述(pdf))。对于它的价值,多项概率产生与 mlogit 相似的结果。

尽管违反了 IIA,是否有可能争辩说 mlogit 结果是相当准确的(也许,争辩说它是不完美的但最好的可用模型),如果是这样,什么证据会支持或反驳这种说法?这两篇论文认为,在选民选择领域,多项 logit 至少与多项 probit 一样准确)。

1个回答

如果您的 IIA 测试拒绝 IIA ,那么您应该估计一个替代模型,如嵌套概率或混合多项式 logit。正如您所提到的,您可以将问题分成两个嵌套的二分法:私人与否,以及 Ngo 或政府。嵌套方法已经在 stata 中可用,而混合多项式方法可以在这里找到:http: //ideas.repec.org/a/tsj/stataj/v6y2006i2p229-245.html 混合 mlogit 方法引入了一个常见的随机参数对于您的三个类别,这样可以考虑跨类别的依赖关系。