对多个相关结果使用多项逻辑回归

机器算法验证 物流 多项分布 多元回归
2022-04-09 12:58:41

将两个二元因变量重新组合成一个 4 水平因变量以利用多项回归是否是常见做法(并且足够)?例如,假设我们有关于两个相关条件(结果)A 和 B 的信息。一个新的 4 类变量将被定义为:

category 1 = Neither conditions A nor B
category 2 = Condition A (only)
category 3 = Condition B (only)
category 4 = Both conditions A and B

这允许运行单个多项式回归,而不是使用包含相同预测变量的两个二元逻辑模型。

3个回答

正如@Riaz Rizvi 建议的那样,这可能不是一个好主意。

您的方案通过以这种方式展平为多项式,对问题实施了特定的(而且不太可能的)协方差结构。由于您怀疑或至少希望允许 A 的存在提供 B 的信息,那么您应该使用二元概率使用两个独立的逻辑模型将无法表示这一点。该模型是一个回归,具有显式相关的双变量潜在变量,生成选择概率,如链接中简要讨论的那样,并且在良好的计量经济学文本中进行了更详细的讨论。

在这种情况下,多项式非常好,但要付出两个代价:

  • 参数数量的爆炸式增长。(如果你要像这样组合二进制变量,你将有参数而不是原来的。)n2nn
  • 如果原始变量实际上是独立的,则解决方案更难解释。(如果您有一个简单的关系,例如输入变量意味着因变量,那么您现在将意味着组合因变量具有对应于的许多结果之一。)xy=1xy=1

主要优点是您的模型可以使用附加参数来编码原始模型中不可能的分布。

我不这么认为。多项分布派生自 n 个自变量,但您的情况有两个因变量。多项回归在这里不适用。