Stata 的回归命令中常用的“稳健”选项使用 Huber-White 三明治估计器给出标准误差。
t 统计量也使用这些标准误差。但是,我注意到沿计算的 p 值使用学生分布,就像在具有正态性假设的“常规”OLS 回归中一样。
我认为同方差假设的发布意味着我们必须依赖 OLS 估计量的渐近特性,因此将 t 统计量与标准正态分布进行比较......
我错过了什么 ?
Stata 的回归命令中常用的“稳健”选项使用 Huber-White 三明治估计器给出标准误差。
t 统计量也使用这些标准误差。但是,我注意到沿计算的 p 值使用学生分布,就像在具有正态性假设的“常规”OLS 回归中一样。
我认为同方差假设的发布意味着我们必须依赖 OLS 估计量的渐近特性,因此将 t 统计量与标准正态分布进行比较......
我错过了什么 ?
稳健的方差估计器需要大样本才能有效。在小样本中,它们偏向下,并且基于正态分布的置信区间的覆盖率可能低于名义覆盖率。
用一个- 保守的分布近似是一种可能的解决方案:您希望在将测试提供给期刊裁判之神之前,这足以使尾巴变胖。其他想法是将残差平方乘以(或类似的东西)来膨胀它们(Stata 也这样做),或者更高阶的渐近扩展,或者像 bootstrapping 这样的重采样方法。这里是观察次数和参数的数量。
Imbens 和 Kolesar (2012)对这些文献进行了很好的调查。他们举了一个很好的例子在您进行二元处理且处理过的观察结果很少的情况下,近似值会出错。使用太慷慨了。
如果您的样本量很大,请使用与正常情况相比,根本不重要。