时间序列数据的空间自相关

机器算法验证 r 时间序列 相关性 空间的 时空
2022-03-14 05:40:35

我有一个 20 年的数据集,其中包含一组多边形(约 200 个不规则形状的连续多边形)的物种丰度年度计数。我一直在使用回归分析来推断每个多边形的趋势(每年的计数变化),以及基于管理边界的多边形数据聚合。

我确信数据中存在空间自相关,这肯定会影响聚合数据的回归分析。我的问题是 - 如何对时间序列数据运行 SAC 测试?我是否需要查看每年回归的残差 SAC(全局 Moran's I)?或者我可以用所有年份进行一次测试吗?

一旦我测试是有 SAC,是否有一个简单的方法来解决这个问题?我的统计背景很少,我读过的关于时空建模的所有内容听起来都非常复杂。我知道 R 有一个距离加权自协变量函数——这使用起来简单吗?

我真的很困惑如何评估/解决这个问题的 SAC,非常感谢任何建议、链接或参考。提前致谢!

2个回答

根据本文,OLS在存在空间自相关的情况下是一致的,但标准误不正确,需要调整。Solomon Hsiang 为此提供了stata 和 matlab 代码不幸的是,我不熟悉任何 R 代码。

在空间统计中,肯定有其他方法可以解决这类问题,这些方法明确地对空间过程进行建模。这只是夸大了标准错误。

不幸的是,理论计量经济学家似乎乐于混淆视听。链接的论文真的很难阅读。基本上它说的是运行你想要的任何回归,然后再去修复标准错误。在您尝试估计估计器的方差之前,空间不会进入它。直观地说,如果所有差异都接近,您就不太确定您的估计不仅仅是一些未观察到的空间冲击的遗物。

请注意,您需要指定您认为空间过程可能正在运行的内核带宽。

这个答案基本上是我在这里所做的类似答案的复制/粘贴重新散列

如果问题是自相关错误,是的=Xβ+,=ρW+ε,那么 OLS 是一致的,但效率低下,正如 ACD 所说。这就像时间序列计量经济学中的序列相关性。

但是如果存在空间自依赖(也称为自相关,令人困惑), 是的=ρW是的+Xβ+ε,则OLS不一致。这与缺失变量偏差相同。如果你有这两个问题,你需要使用空间杜宾模型,是的=ρW是的+Xβ+WXλ+ε.

R的spdep包包含许多计算空间权重矩阵、估计空间回归和执行其他操作的函数。我对这些函数有很多经验lagsarlm,但在包文档中看到有一个sacsarlm函数似乎更符合您的要求。

就您问题的时间方面而言,您对依赖关系所做的假设将大大有助于确定您的模型规范。您的区域是否直接相互影响?这方面的例子是贸易或住房市场;一个国家的出口高度依赖另一个国家的进口,而最近购买的房屋的销售价格对附近房屋的销售价格有非常重要的贡献。在这种情况下,指定权重矩阵是有意义的W来适应这种依赖。准时买房及时与房屋做“邻居”-1,但没有及时与房屋+1.

如果您的术语相互关联但在逻辑上不相互依赖,例如农业产量,那么使用单个时间不敏感矩阵可能更有意义W,但要在X规格。