解释逻辑回归中的分箱残差图

机器算法验证 回归 物流 残差
2022-03-16 10:14:10

我正在执行逻辑回归24自变量和123,996观察。我正在评估模型拟合,以确定数据是否符合模型假设,并使用arm R包生成以下分箱残差图:

在此处输入图像描述

显然,该图中有一些不好的迹象:许多点落在置信带之外,并且残差有一个独特的模式。我的问题是 - 我可以将这些问题附加到逻辑回归模型的特定假设吗?例如,我可以说自变量或异方差存在非线性的证据吗?如果没有,我是否可以生成其他诊断信息来帮助确定问题所在?


根据丹尼尔的回答,主要问题似乎是我在 logit 量表上使用残差,但在响应量表上使用预期值。如果我在响应尺度上重现带有残差的图,它看起来像这样:

在此处输入图像描述

这更可信。

1个回答

要么我误解了你的情节,要么有一些问题。您对接近 0 的预期值有负残差这一事实意味着您的模型正在预测负值。对于仅在 (0, 1) 区间内进行预测的逻辑回归模型,这应该是不可能的,除非您使用模型的对数赔率输出,在这种情况下残差应该是未定义的。由于逻辑回归是一种分类方法,所以先看混淆矩阵更有用。您还应该指定图表是基于训练数据还是单独的测试集。