在回归和其他故事中,作者指出,异方差和非正态误差仅在从线性模型进行预测时才会出现问题(1;第 154-155 页):
- 误差的相等方差。当回归用于概率预测时,不等误差方差(也称为异方差,与等方差或同方差相反)可能是一个问题,但它不影响回归模型通常最重要的方面,即进入预测变量的信息以及它们如何组合。如果回归误差的方差不相等,则通过在模型中考虑这一点来更有效地进行估计,如第 10.8 节中讨论的加权最小二乘法。然而,在大多数情况下,这个问题是次要的。
- 错误的常态。在预测单个数据点时,误差项的分布是相关的。为了估计回归线(与预测单个数据点相比),正态性假设通常根本不重要。因此,我们不建议对回归残差的正态性进行诊断。例如,许多教科书推荐分位数-分位数 (QQ) 图,其中将有序残差与来自正态分布的有序抽取的相应预期值进行对比,该图与线性的偏离表明误差项的非正态性。制作这样的图并没有错,在评估使用模型预测单个数据点时它可能是相关的,但我们通常更关心有效性的假设,
我从上面的文字中的理解是,作者认为违反这些假设不是模型系数估计的问题。为什么违反这些假设只是一个预测问题?
此交叉验证答案中讨论了非正常错误,但是我希望得到更多涉及基础数学或参考外部资源的答案。
参考:
- A. Gelman、J. Hill、A. Vehtari,回归和其他故事(剑桥大学出版社,2020 年)https://doi.org/10.1017/9781139161879。