Stata 中的稳健选项:为什么使用学生分布计算 p 值?

机器算法验证 状态 异方差
2022-04-16 07:09:03

Stata 的回归命令中常用的“稳健”选项使用 Huber-White 三明治估计器给出标准误差。

t 统计量也使用这些标准误差。但是,我注意到沿计算的 p 值使用学生分布,就像在具有正态性假设的“常规”OLS 回归中一样。

我认为同方差假设的发布意味着我们必须依赖 OLS 估计量的渐近特性,因此将 t 统计量与标准正态分布进行比较......

我错过了什么 ?

1个回答

稳健的方差估计器需要大样本才能有效。在小样本中,它们偏向下,并且基于正态分布的置信区间的覆盖率可能低于名义覆盖率。

用一个tnk- 保守的分布近似是一种可能的解决方案:您希望在将测试提供给期刊裁判之神之前,这足以使尾巴变胖。其他想法是将残差平方乘以nnk(或类似的东西)来膨胀它们(Stata 也这样做),或者更高阶的渐近扩展,或者像 bootstrapping 这样的重采样方法。这里n是观察次数和k参数的数量。

Imbens 和 Kolesar (2012)对这些文献进行了很好的调查他们举了一个很好的例子t在您进行二元处理且处理过的观察结果很少的情况下,近似值会出错。使用n=nT+nC太慷慨了。

如果您的样本量很大,请使用t与正常情况相比,根本不重要。