解释案例影响统计(杠杆、学生化残差和库克距离)

机器算法验证 回归 诊断 残差 杠杆作用 厨师距离
2022-04-14 10:30:20

我只是想澄清一些关于杠杆、学生化残差和库克距离的事情:

  1. 大(绝对值)学生化残差是否意味着案例是异常值?

  2. 库克距离大是否意味着一个案例肯定有影响?同样,库克距离小是否意味着一个案例肯定没有影响?

  3. 一个案例可以有一个小的杠杆,但一个大的(绝对值)学生化残差?

1个回答
  1. 不,您有较大的学生化残差这一事实并不一定意味着观察结果是异常值(尽管有些人将异常值简单地定义为大残差,但在这种情况下,它是根据定义。)
  2. “有影响力”有点模棱两可。人们可以将杠杆率视为影响力的衡量标准,或者将 DFbeta 视为影响力的衡量标准,而这两者都不能完美地跟踪库克的距离。因此,库克的距离不一定等于影响力;但是我想您将它们用作同义词,这在某些情况下可能是合理的。在那种情况下,库克的距离确实衡量了影响力,但这是同义反复的。
  3. 是的,一个案例可以有杠杆(如果),并且有任何大小的残差。 0xi=x¯

它可以帮助您在这里阅读我的答案:解释 plot.lm()