原始残差与标准化残差与学生化残差 - 何时使用?

机器算法验证 拟合优度 残差
2022-02-06 22:13:58

看起来像一个类似的问题,并没有得到很多回应。

省略诸如 Cook's D 之类的测试,仅将残差视为一个组,我对其他人在评估拟合优度时如何使用残差感兴趣。我使用原始残差:

  1. 在 QQ 图中,用于评估正态性
  2. 与残差的散点图中,用于 (a) 异方差性和 (b) 序列自相关的眼球检查。y

为了绘制与残差来检查可能出现异常值,我更喜欢使用学生化的残差值的哪些残差是有问题的,尽管标准化残差提供了极其相似的结果。我使用的理论是,这取决于一个人去了哪所大学。yyy

这与其他人使用残差的方式相似吗?其他人是否将这一数量的图表与汇总统计数据结合使用?

2个回答

这与其说是对术语的澄清,不如说是一个答案。您的问题询问原始、标准化和学生化残差。然而,这不是大多数统计学家使用的术语,尽管我注意到你的课堂笔记指出它是。

生:和你一样。

标准化:这实际上是原始残差除以残差的真实标准差。由于很少知道真正的标准差,因此几乎从不使用标准化残差。

内部学生化:因为通常不知道残差的真实标准差,所以使用估计的标准差代替。这是一个内部学生化的残差,这就是你所说的标准化。

外部学生化:与内部学生化残差相同,只是残差的标准差的估计是从回归中计算出来的,忽略了相关的观察。

Pearson:原始残差除以响应变量(y 变量)而不是残差的标准差。你没有列出这个。

“leave one out”:没有正式名称,但和课堂笔记一样。

标准化“留一个”:也没有正式名称,但这不是课堂笔记所说的学生化。

资料来源:

  1. 您拥有的关于学生化残差的相同 wiki 链接(“学生化残差是残差除以其标准差的估计值得到的商”)

  2. SAS中残差计算的文档

回复:地块,

存在过度拟合之类的事情,但过度绘图并不会真正造成太大伤害,尤其是在诊断阶段。标准化的正态概率图不会在您的 QQ 图旁边受到伤害。我发现最好评估分布的中间值。

回复:残差,

我在草稿阶段同时运行标准化残差和学生化残差,通常最终对标准化残差进行编码。我不知道其他人实际运行的是什么,因为诊断确实编码在我在网上找到的复制材料中。

回复:诊断,

对于线性模型,我通常添加方差膨胀因子(使用vifStata 中的命令)和一些同方差性测试(例如使用hettestStata 中的命令),以及使用嵌套回归的模型分解来检查是否R2有任何意义。