广义线性模型中通常使用什么样的图,它们的解释是什么?
特别是对于标准化偏差残差与拟合值图,我们可以从图中看到什么?
广义线性模型中通常使用什么样的图,它们的解释是什么?
特别是对于标准化偏差残差与拟合值图,我们可以从图中看到什么?
来自StatSoft,没有链接:
广义线性模型中的诊断。残差的两种基本类型是所谓的 Pearson 残差和偏差残差。Pearson 残差基于观察到的响应与预测值之间的差异;偏差残差基于观察到的响应对对数似然统计量的贡献。此外,可以计算杠杆分数、学生化残差、广义 Cook's D和其他观察统计数据(基于个人观察的统计数据)。有关这些统计数据的描述和讨论,请参见 Hosmer 和 Lemeshow (1989)。
如果您使用的是 R:
lrfit <- glm( cbind(using,notUsing) ~ age * noMore + hiEduc , family=binomial)
summary(lrfit)
plot(lrfit)
R 遵循流行的习惯,即根据 p 值用一颗、两颗或三颗星标记显着系数。试试
plot(lrfit)
。您会得到与线性模型相同的图,但适用于广义线性模型;例如,绘制的残差是偏差残差(观察对偏差的贡献的平方根,与原始残差具有相同的符号)。可用于从拟合中提取结果的函数包括
residuals
或resid,
对于偏差残差fitted
或者fitted.values
,对于拟合值(估计概率)predict
, 对于线性预测器(估计的 logits)coef
或coefficients
, 对于系数, 和deviance
, 为偏差。其中一些函数具有可选参数;例如,您可以提取五种不同类型的残差,分别称为“偏差”、“皮尔森”、“响应”(响应 - 拟合值)、“工作”(IRLS 算法中的工作因变量 - 线性预测器)和“部分”(通过省略模型中的每个项形成的工作残差矩阵)。您可以使用 type 参数指定您想要的那个,例如
residuals(lrfit,type="pearson")
.
根据您的研究类型,可能需要进行更正。