R中的逻辑回归诊断图

机器算法验证 r 回归 物流 广义线性模型 诊断
2022-03-20 05:47:16

出于测试目的,我在 R 中编写了一些相关数据,如下所示:

mydata = data.frame(
  outcome   = c(1, 0, 1, 0, 0, 1, 1, 0, 1, 1),
  predictor = c(0.1, -0.2, 0, 0.1, -0.3, 0.3, 0.2, -0.1, 0.1, 0.1)
)

然后我这样做是为了创建一个对这些数据建模的逻辑模型:

model1 = glm(family = binomial, formula = outcome ~ predictor, data = mydata)

运行plot(model1)产生以下图:

在此处输入图像描述

在此处输入图像描述

我需要回答一些问题,以便了解如何对这样的逻辑模型进行诊断。作为一个只有统计学入门课程的人,我无法收集有关如何解释图表的知识。

  1. 第一个图中的“预测值”代表什么?
  2. 在逻辑回归的背景下,残差是什么意思?
  3. 这些图中的哪一个可以以任何方式对基于真实数据的模型诊断有用?如何?
1个回答

这个问题与:plot(glm.model) 的解释有关,它可能对您有所帮助。关于您的具体问题:

  1. 逻辑回归中预测值的构成是一个棘手的问题。这是因为可以在几个不同的尺度上进行预测。我认为最直观的预测值是给定观察的“成功”拟合概率。但是,您也可以使用拟合的赔率或拟合的对数赔率统计软件返回的拟合模型方程/系数将在线性预测器的尺度上,即在对数优势尺度上。因此,“成功”的拟合对数几率通常用作默认值。R例如,?predict.glm将默认为type="link"(对数赔率);因为您的预测值低于0,很明显,成功的对数几率是正在绘制的。

    以下是一些可能对您有所帮助的其他资源:

  2. 同样,逻辑回归中残差的构成更加棘手。很多方法可以计算广义线性模型的残差。在我看来,最直观的残差是原始残差(),但它们实际上很难使用,所以你很可能永远看不到它们。默认情况下,?residuals.glm默认为. 偏差残差反映了数据对模型总偏差的贡献。Germán Rodríguez 的 GLM 课程 的讲义中简要讨论了偏差残差(以及其他一些常见类型) 。ri=yiy^itype="deviance"

    推荐阅读:

  3. 在我对顶部链接的线程的回答中,我认为最好不要使用这些来检查拟合的逻辑回归模型。

    进一步阅读: