在违反同方差假设的回归中,自举标准误差和置信区间是否合适?

机器算法验证 回归 引导程序 最小二乘 异方差
2022-01-20 20:58:03

如果在标准 OLS 回归中违反了两个假设(误差的正态分布、同方差性),那么自举标准误差和置信区间是否是获得关于回归系数显着性的有意义结果的合适替代方案?

具有自举标准误差和置信区间的显着性检验是否仍然对异方差“有效”?

如果是,那么可以在这种情况下使用的适用置信区间是多少(百分位数、BC、BCA)?

最后,如果在这种情况下自举是合适的,那么需要阅读和引用哪些相关文献才能得出这个结论?任何提示将不胜感激!

1个回答

至少有三种(可能更多)方法可以使用独立但不同分布的数据执行线性回归的引导程序。(如果您有其他违反“标准”假设的情况,例如,由于与时间序列数据的自相关,或由于抽样设计导致的聚类,事情会变得更加复杂)。

  1. 您可以将观察作为一个整体重新采样,即,在替换的情况下进行采样(yj,xj)从原始数据{(yi,xi)}. 这将渐近等效于执行Huber-White 异方差校正
  2. 您可以拟合您的模型,获得残差ei=yixiβ^, 并独立地重新采样xjej从它们各自的经验分布中替换,但这打破了异方差模式,如果有的话,所以我怀疑这个引导程序是否一致。
  3. 您可以执行狂野的引导程序,在其中重新采样残差的符号,它控制条件第二时刻(并且,通过一些额外的调整,也可以控制条件第三时刻)。这将是我推荐的程序(前提是你可以理解它并在被问到“你做了什么来控制异方差?你怎么知道它有效?”时为其他人辩护)。

最终的参考是吴(1986),但年鉴并不完全是绘本阅读。

基于评论中提出的 OP 后续问题的更新:

复制的数量对我来说似乎很大;我知道的关于这个引导参数的唯一很好的讨论是在Efron & Tibshirani 的 Intro to Bootstrap 书中

我相信对于缺乏分布假设的一般类似的修正可以通过 Huber/White 标准误差获得。Cameron & Triverdi 的教科书讨论了对 bootstrap 和 White 的异方差校正的等价性。等价性遵循一般稳健性理论M- 估计:这两种修正都旨在修正分布假设,无论它们可能是什么,都具有残差有限二阶矩的最小假设和观察之间的独立性。另请参阅Hausman 和 Palmer (2012)关于有限样本中更具体的比较(本文的一个版本可在作者的一个网站上获得)关于 bootstrap 和异方差校正之间的比较。