具有异方差性的线性回归 (OLS) 系数解释

机器算法验证 回归 最小二乘 解释 回归系数 异方差
2022-04-14 02:32:21

要使用OLS进行推理,是否必须在所有情况下都满足同方差的前提?

我需要在真实案例中检查某些特征(例如年龄、收入...)对变量 y(我是否购买房产)的影响。我考虑过使用线性回归来解释系数,我知道如果存在异方差性,它会影响显着性检验的可靠性,并且置信区间不正确。但我不确定它是否也会影响回归系数。

1个回答

异方差性使得 OLS 估计量不是回归斜率的最佳线性无偏估计量,并使得通常的标准误差(以及基于它们的数量,例如 p 值和置信区间)不正确。它不影响回归系数的解释,这不取决于估计程序或假设,而是取决于模型的结构。也就是说,如果您指定

E[Y|X]=β0+β1x1+...+βkxk
通常的回归模型,无论您如何估计系数或假设是否有效都无关紧要。该模型本身告诉您,对于两个不同的观察x1一个单位,但在其他预测变量上相同,则其结果的预期差异为β1. 您可能会使用一种糟糕的方法来估计系数,但这不会改变它们的解释。

如果您有异方差性,只需使用稳健的标准误差并继续。