我试图估计一个具有三个选择的职业选择模型。在处理这种无序的分类结果时,是否有任何替代方法可以使用多项逻辑回归?
在处理二元因变量时,似乎有几种选择,例如 LPM 模型以及二元概率和 logit 模型。然而,在处理无序分类变量时,文献不断推荐多项式 logit 模型,而不将其与替代方案进行比较。
我试图估计一个具有三个选择的职业选择模型。在处理这种无序的分类结果时,是否有任何替代方法可以使用多项逻辑回归?
在处理二元因变量时,似乎有几种选择,例如 LPM 模型以及二元概率和 logit 模型。然而,在处理无序分类变量时,文献不断推荐多项式 logit 模型,而不将其与替代方案进行比较。
有多种模型可用于对多项模型进行建模。
我推荐使用 Stata 的 Cameron & Trivedi Microeconometrics进行简单而出色的介绍,或者查看Imbens & Wooldridge Lecture Slide s 或此处可在线获取。
广泛使用的模型包括:
多项条件 logit(不仅可以轻松包含特定于个人的预测变量,还可以包含特定于选择的预测变量)或Stata 中的asclogit
嵌套的 logit (通过以分层方式对选择进行分组/排名来放松与不相关替代假设 (IIA) 的独立性)或Stata 中的nlogit
混合 logit(通过假设例如正态分布参数来放松 IIA 假设)或Stata 中的mixlogit。
多项概率模型(可以进一步放宽 IIA 假设,但您应该有可用的特定于选择的预测器)混合 logit(放宽 IIA 假设假设例如正态分布参数),在 Stata 中使用asmprobit(mprobit 不允许使用特定于选择的预测器,但您应该使用它们来放松 IIA 假设)
如果您想要与逻辑回归完全不同的选项,您可以使用神经网络。例如,R 的nnet
包有一个multinom
功能。或者您可以使用随机森林(R 的randomForest
包等)。还有其他几种机器学习替代方案,尽管像 SVM 这样的选项往往没有得到很好的校准,这使得它们的输出在我看来不如逻辑回归。
[实际上,神经网络中的神经元可能正在使用 logit。所以它是完全不同的,但同时又不是完全不同。]
此外,考虑到与检查 IIA 假设有关的这些测试的不可靠性,认为神经网络(具有 softmax 激活)、决策树(或随机森林)不需要满足 IIA 假设。因此,如果我们只关心预测,那么与多项式逻辑相比,这可能是一个优势。
或者,可以以第 K 个类别为参考,为 K-1 类别构建多个逻辑模型。与多项式相比,这也允许为每个方程插入不同的预测变量