可视化广义线性模型

机器算法验证 数据可视化 广义线性模型
2022-03-28 03:12:16

广义线性模型中通常使用什么样的图,它们的解释是什么?

特别是对于标准化偏差残差与拟合值图,我们可以从图中看到什么?

1个回答

来自StatSoft,没有链接:

广义线性模型中的诊断。残差的两种基本类型是所谓的 Pearson 残差和偏差残差Pearson 残差基于观察到的响应与预测值之间的差异;偏差残差基于观察到的响应对对数似然统计量的贡献。此外,可以计算杠杆分数、学生化残差广义 Cook's D和其他观察统计数据(基于个人观察的统计数据)。有关这些统计数据的描述和讨论,请参见 Hosmer 和 Lemeshow (1989)。

如果您使用的是 R:

lrfit <- glm( cbind(using,notUsing) ~ age * noMore + hiEduc , family=binomial)
summary(lrfit)
plot(lrfit)

引自Germán Rodríguez

R 遵循流行的习惯,即根据 p 值用一颗、两颗或三颗星标记显着系数。试试plot(lrfit)您会得到与线性模型相同的图,但适用于广义线性模型;例如,绘制的残差是偏差残差(观察对偏差的贡献的平方根,与原始残差具有相同的符号)。

可用于从拟合中提取结果的函数包括

  • residualsresid,对于偏差残差
  • fitted或者fitted.values,对于拟合值(估计概率)
  • predict, 对于线性预测器(估计的 logits)
  • coefcoefficients, 对于系数, 和
  • deviance, 为偏差。

其中一些函数具有可选参数;例如,您可以提取五种不同类型的残差,分别称为“偏差”、“皮尔森”、“响应”(响应 - 拟合值)、“工作”(IRLS 算法中的工作因变量 - 线性预测器)和“部分”(通过省略模型中的每个项形成的工作残差矩阵)。您可以使用 type 参数指定您想要的那个,例如residuals(lrfit,type="pearson").

根据您的研究类型,可能需要进行更正。