是什么导致空间相关图中出现 U 形图案?

机器算法验证 自相关 空间的
2022-03-03 10:27:14

我在自己的工作中注意到这种模式,当检查不同距离的空间相关图时,相关性中会出现 U 形模式。更具体地说,小距离箱中的强正相关随着距离而减小,然后在特定点到达坑然后爬回。

以下是保护生态学博客Macroecology playground (3) – Spatial autocorrelation中的一个示例。

Moran's I 相关图

这些在更远距离上更强的正自相关理论上违反了托布勒的第一地理定律,所以我认为它是由数据中的其他模式引起的。我希望它们在一定距离处达到零,然后在更远的距离处徘徊在 0 附近(这通常发生在具有低阶 AR 或 MA 项的时间序列图中)。

如果您进行谷歌图片搜索,您可以找到其他一些相同类型模式的示例(参见此处了解其他示例)。GIS 站点上的用户发布了两个示例,其中 Moran's I 出现了该模式,但 Geary's C ( 1 , 2 )没有出现该模式结合我自己的工作,这些模式对于原始数据是可观察到的,但是当使用空间项拟合模型并检查残差时,它们似乎不会持续存在。

我在时间序列分析中没有遇到过显示类似 ACF 图的示例,因此我不确定原始数据中的哪种模式会导致这种情况。Scortchi 在此评论中推测正弦模式 可能是由该时间序列中省略的季节性模式引起的。相同类型的空间趋势会导致空间相关图中的这种模式吗?或者它是计算相关性的方式的其他人工制品?


这是我工作中的一个例子。样本相当大,浅灰色的线是原始数据的19个排列生成参考分布的集合(所以可以看到红线的方差预计会很小)。因此,虽然情节不像第一个所示那样戏剧化,但在情节中很容易出现坑然后在更远的距离上升。(还要注意我的坑不是负面的,其他例子也是如此,如果这在本质上使例子不同,我不知道。)

在此处输入图像描述

这是数据的核密度图,以查看产生所述相关图的空间分布。

DC中的KDE犯罪

1个回答

解释

当在发生现象的区域的整个范围内进行计算时,U 形相关图很常见。它特别出现在自然界中的羽状现象中,例如土壤或地下水中的局部污染,或者在这种情况下,这种现象与人口密度有关,人口密度通常向研究区域的边界(地区哥伦比亚,拥有高密度的城市核心,被低密度的郊区包围)。

回想一下,相关图根据它们的空间分离量总结了所有数据的相似程度。较高的值更相似,较低的值不太相似。可以实现最大空间分离的唯一点对是位于地图直径相对两侧的点。因此,相关图将沿边界的值相互比较。当数据值总体趋向于向边界减小时,相关图只能将小值与小值进行比较。它可能会发现它们非常相似。

因此,对于任何羽状或其他空间单峰现象,我们可以在收集数据之前预测相关图可能会减小,直到达到该区域直径的大约一半,然后它会开始增加。

次要影响:估计可变性

第二个影响是在短距离比在长距离有更多的数据点对可用于估计相关图。在中长距离上,这些点对的“滞后种群”会减少。这增加了经验相关图的可变性。有时,仅这种可变性就会在相关图中产生不寻常的模式。显然,在顶部(“Moran's I”)图中使用了一个大型数据集,这减少了这种影响,但尽管如此,在距离超过 3500 左右的地方,局部波动的幅度更大,变异性的增加是显而易见的:恰好一半最大距离。

因此,空间统计中长期存在的经验法则是避免在大于研究区域直径一半的距离处计算相关图,并避免使用如此大的距离进行预测(例如插值)。

为什么空间周期性不是完整的答案

有关空间统计的文献确实指出,空间周期性模式会导致相关图在较大距离处出现反弹。采矿地质学家称之为“洞效应”。存在一类包含正弦项的变异函数以便对其进行建模。然而,这些变异函数也都随着距离产生了一些强烈的衰减,因此不能解释第一个图中显示的完全相关的极端回归。此外,在二维或更多维度中,现象不可能既是各向同性的(其中方向相关图都是相同的)又是周期性的。因此,仅数据的周期性并不能解释所显示的内容。

可以做什么

在这种情况下进行的正确方法是接受这种现象不是静止的,并采用一个模型,根据一些潜在的确定性形状来描述它——“漂移”或“趋势”——在漂移周围有额外的波动它可能具有空间(和时间)自相关。另一种获取犯罪计数等数据的方法是研究不同的相关变量,例如每单位人口的犯罪率。