考虑下图来自 Faraway's Linear Models with R (2005, p. 59)。
第一个图似乎表明残差和拟合值不相关,因为它们应该在具有正态分布误差的同方差线性模型中。因此,似乎表明残差和拟合值之间的依赖性的第二和第三图表明了不同的模型。
但是,正如 Faraway 所指出的,为什么第二个图建议使用异方差线性模型,而第三个图建议使用非线性模型?
第二个图似乎表明残差的绝对值与拟合值呈强正相关,而在第三个图中没有明显的这种趋势。因此,如果是这样的话,从理论上讲,在具有正态分布误差的异方差线性模型中
(左边的表达式是残差和拟合值之间的方差-协方差矩阵)这可以解释为什么第二个和第三个图与 Faraway 的解释一致。
但情况是这样吗?如果不是,那么法拉维对第二和第三情节的解释还有什么理由呢?另外,为什么第三个图必然表明非线性?它不可能是线性的,但是误差不是正态分布的,或者它们是正态分布的,但不以零为中心?