通过回归建模空间趋势( x , y)(x,y)坐标作为预测变量

机器算法验证 回归 多重回归 空间的 自相关
2022-03-22 05:43:12

我计划将坐标作为协变量包含在回归方程中,以调整数据中存在的空间趋势。之后,我想测试随机变化中空间自相关的残差。我有几个问题:

  1. 我应该执行线性回归,其中只有自变量是坐标,然后测试空间自相关的残差,还是我应该不仅包括坐标作为协变量,还包括其他变量,然后测试残差。xy

  2. 如果我希望有二次趋势,然后不仅包括,还,但是其中一些()的值高于阈值——我应该排除那些值较高的变量不显着吗?那么我应该如何解释趋势,它肯定不再是二次的了?x,yxyx2y2xyy2pp

  3. 我想我应该将坐标视为任何其他协变量,并通过构造部分残差图来测试它们与因变量的线性关系......但是一旦我转换它们(如果它们表明它们需要转换),那将不会不再是那种趋势(特别是如果我将包括在二次趋势中)。例如,它可能表明需要转换,而不需要转换?在这些情况下我应该如何反应?xyxyx2y2x2x

谢谢你。

1个回答

我认为你可能会更好地拟合具有空间相关随机效应的线性混合效应模型(有时称为地统计模型)。假设您的数据是高斯数据,您可以指定以下形式的模型:

Yi=μi+Si+ϵi,

对于观测值,其中表示 iid 错误,表示您的空间项(其中)。平均值可能是其他协变量的函数(即等)或者它可能只是一个常数(可能最好从后者为简单起见)。n1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μiμi=β0+β1xi1+β2xi2

可以通过查看经验变异函数来指定空间项的相关矩阵(它决定了您认为每个观察值应该有多相关)。通常,选择观察值之间的相关性仅取决于它们之间的距离(这是您的坐标进入模型的地方)。R

Diggle 和 Ribeiro (2000)的基于模型的地质统计学的第 2 章应该会给您更详细的介绍。R 包 geoR 有许多用于拟合地统计模型的过程,因此您可能会发现它很有用(参见http://cran.r-project.org/web/packages/geoR/geoR.pdf)。