Angrist 和 Pischke 建议鲁棒(即对异方差或不等方差具有鲁棒性)标准误差作为理所当然的事情而不是对其进行测试来报告。两个问题:
- 当存在同方差时,这样做对标准误有什么影响?
- 有人真的在他们的工作中这样做吗?
Angrist 和 Pischke 建议鲁棒(即对异方差或不等方差具有鲁棒性)标准误差作为理所当然的事情而不是对其进行测试来报告。两个问题:
使用稳健的标准误已成为经济学中的常见做法。稳健标准误差通常大于非稳健(标准?)标准误差,因此这种做法可以被视为保守的努力。
在大样本中(例如,如果您正在处理具有数百万个观测值的人口普查数据或具有“仅”数千个观测值的数据集),异方差检验几乎肯定会出现阳性结果,因此这种方法是合适的。
对抗异方差的另一种方法是加权最小二乘法,但这种方法已被忽视,因为它改变了参数的估计值,这与使用稳健标准误差不同。如果你的权重不正确,你的估计就有偏差。但是,如果您的权重是正确的,那么您会得到比具有稳健标准错误的 OLS 更小的(“更有效”)标准错误。
稳健标准误差提供了异方差下的无偏标准误差估计。有几本统计教科书提供了关于稳健标准误差的大量和冗长的讨论。以下网站提供了关于稳健标准错误的较为全面的总结:
https://economictheoryblog.com/2016/08/07/robust-standard-errors/
回到你的问题。使用稳健的标准误差并非没有注意事项。根据 Woolridge(2009 年版,第 268 页)使用稳健标准误差,如果样本量很大,获得的 t 统计量仅具有与精确 t 分布相似的分布。如果样本量很小,使用稳健回归获得的 t-stats 可能具有不接近 t 分布的分布。这可能会引发推理。此外,在同方差的情况下,稳健的标准误差仍然是无偏的。但是,它们效率不高。也就是说,传统的标准误差比稳健的标准误差更精确。最后,使用稳健的标准误差是许多学术领域的常见做法。
在Introductory Econometrics(Woolridge,2009 年版,第 268 页)中解决了这个问题。Woolridge 说,当使用稳健标准误差时,如果样本量很大,获得的 t 统计量仅具有与精确 t 分布相似的分布。如果样本量很小,使用稳健回归获得的 t-stats 可能具有不接近 t 分布的分布,这可能会导致推断失败。
避免使用稳健标准误差的原因有很多。从技术上讲,发生的事情是,方差会被你在现实中无法证明的权重加权。因此,鲁棒性只是一种修饰工具。一般来说,您应该考虑更改模型。
以更好的方式处理异质性有很多含义,而不仅仅是描绘数据中出现的问题。以此作为切换机型的标志。这个问题与如何处理异常值的问题密切相关。有些人只是删除它们以获得更好的结果,在使用稳健标准错误时几乎相同,只是在另一种情况下。