校正 R 中简单线性回归中的自相关

机器算法验证 回归 自相关
2022-03-03 16:23:49

我对天气变量(例如每月总降雨量)进行了昆虫数量的简单线性回归。我以前从不知道自相关,但我手稿的审稿人要求我测试自相关并运行模型来解释它的发生。

我发现 Macro 关于“如何测试残差的自相关? ”的建议非常容易理解,并且对于像我这样的初学者测试自相关很有帮助。我发现在我的一些线性回归模型中出现了自相关,但我还没有这么简单的方法来校正自相关。大多数答案都涉及复杂的方程(使用“spdep”、“sphet”、“gmm”等软件包),而不是直接运行校正模型的 R 命令。

我将非常感谢能帮助我通过一种简单的方法从我的数据中获取意义的人。

2个回答

自相关误差信号模型错误指定。理想情况下,模型误差应该是i.i.d.因此其中不应该有任何模式。如果他们这样做了,就会有一些信息未被提取;可以进行更多建模来提取模式。

有两种方法可以处理自相关错误的问题。

  1. 保持模型规格不变,但围绕回归系数扩大置信区间,以说明违反模型假设的非自相关误差。这可能是出于希望保留原始模型的动机,该模型可能直接源自理论和/或具有良好的解释。这可以通过使用异方差和自相关 (HAC) 稳健标准误差来完成,例如 Newey 和 West (1987)。HAC 标准误差(作为常规标准误差的替代)应在任何主要的统计软件包中可用;它们似乎在从业者中很受欢迎,也许是因为它们提供了一个简单的解决方案。
    优点:易于使用;可以保留原来的模型。
    缺点:更宽的置信区间更低的精度,更低的功率(更难拒绝零假设);型号指定错误;不太准确的预测(由于忽略了模型误差的自相关)。
  2. 更改模型规格以获得非自相关误差。例如,运行带有 ARMA 错误的回归(易于通过arimaauto.arimaR 中的函数实现,包括通过参数的回归xreg量)或 - 正如 DJohnson 建议的那样 - 包括因变量的滞后作为回归量。
    优点:更窄的置信区间更高的精度,更多的力量(更容易拒绝零假设);模型被正确指定(除非有其他错误,这通常是真的);更准确的预测。
    缺点:需要更多的工作;无法保留原始模型。

我支持 Francis Diebold 的有力论点(在他的博客文章“HAC 皇帝没有衣服”中),即 2. 是要走的路。

参考:

  • 纽维,惠特尼 K;韦斯特,肯尼斯 D (1987)。“一个简单、正半定、异方差和自相关一致协方差矩阵”。计量经济学 55 (3): 703–708。doi:10.2307/1913610

此演示文稿的链接开发了几种直观的方法,用于在测试表明存在自相关时校正自相关。这些方法中的大多数用于AR(1)或一阶过程,包括:

  • 添加/删除变量,例如,包括响应的 1 周期滞后
  • 增加时间周期,例如,从每天到每周,等等
  • 通过一阶差分和乘以自相关系数 rho 来调整误差(对我缺乏乳胶技能表示歉意,但公式在链接的第 17 页):

http://personal.rhul.ac.uk/uhte/006/ec2203/Lecture%2018_Autocorrelation&DynamicModels.pdf

如果这些“简单”解决方案都不起作用,那么就您而言,这些方法变得越来越复杂,并且至少在某些情况下,“治愈”可能比它试图修复的“疾病”更糟糕