机器算法验证 - 可视化广义线性模型 - 吾爱随笔录

可视化广义线性模型

机器算法验证数据可视化广义线性模型

2022-03-28 03:12:16

广义线性模型中通常使用什么样的图，它们的解释是什么？

特别是对于标准化偏差残差与拟合值图，我们可以从图中看到什么？

1个回答

来自StatSoft，没有链接：

广义线性模型中的诊断。残差的两种基本类型是所谓的 Pearson 残差和偏差残差。Pearson 残差基于观察到的响应与预测值之间的差异；偏差残差基于观察到的响应对对数似然统计量的贡献。此外，可以计算杠杆分数、学生化残差、广义 Cook's D和其他观察统计数据（基于个人观察的统计数据）。有关这些统计数据的描述和讨论，请参见 Hosmer 和 Lemeshow (1989)。

如果您使用的是 R：

lrfit <- glm( cbind(using,notUsing) ~ age * noMore + hiEduc , family=binomial)
summary(lrfit)
plot(lrfit)

引自Germán Rodríguez：

R 遵循流行的习惯，即根据 p 值用一颗、两颗或三颗星标记显着系数。试试plot(lrfit)。您会得到与线性模型相同的图，但适用于广义线性模型；例如，绘制的残差是偏差残差（观察对偏差的贡献的平方根，与原始残差具有相同的符号）。

可用于从拟合中提取结果的函数包括

residuals或resid,对于偏差残差

fitted或者fitted.values，对于拟合值（估计概率）

predict, 对于线性预测器（估计的 logits）

coef或coefficients, 对于系数, 和

deviance, 为偏差。

其中一些函数具有可选参数；例如，您可以提取五种不同类型的残差，分别称为“偏差”、“皮尔森”、“响应”（响应 - 拟合值）、“工作”（IRLS 算法中的工作因变量 - 线性预测器）和“部分”（通过省略模型中的每个项形成的工作残差矩阵）。您可以使用 type 参数指定您想要的那个，例如residuals(lrfit,type="pearson").

根据您的研究类型，可能需要进行更正。

其它你可能感兴趣的问题

上一篇离散和连续参数混合的最小化算法？下一篇R中的重复测量ANCOVA？