使用二项式回归模型考虑空间自相关

机器算法验证 r 物流 空间的 空间交互模型
2022-04-07 08:49:09

我正在使用二项式回归模型进行存在/不存在,并使用 20 个自变量进行测试。数据具有 x 和 y 坐标,我想了解如何考虑空间自相关。

我已经研究了变量之间的相关性,并为 1000 个不同的样本运行了相同的模型(我有一个允许我这样做的大数据集)以了解每个参数的分布并检查可能在我的模型中引入问题的变量。

glm_model <- glm(PA ~ Var1 + Var2 + Var3 + Var4 + Var5,family=binomial(link=logit))

但是我相信我还需要考虑空间自相关。我看到有一个包可以帮助我(spdep),但是我不确定我是否完全理解我是否可以使用我的模型。我的问题是我有什么选择?

4个回答

如果您乐于假设您的二项式响应来自通过 logit 链接的空间相关高斯随机场,并且您的非空间协变量具有通常的对数线性形式,则将其全部填充到geoRglm

http://cran.r-project.org/web/packages/geoRglm/vignettes/geoRglmintro.pdf

一旦你调整好你的 MCMC,就会弹出参数估计值。

在我看来,x,y 是模型中潜在的自变量。问题是您提到的二项式回归模型假设自变量不相关。有些人在他们的模型中添加交互项来处理这个问题,但是当你这样做时会丢失很多模型的可解释性。

对于分类问题,您有多种选择。您可以使用例如k-means clustering您可以在此处找到 R 中分类方法的不错的备忘单

我发现这个包的教程spdep非常有用。

最后,您会想要创建这样的空间权重:

us.nb4 <- knearneigh(coordinates(data[,1:2]), k=4)
us.nb4 <- knn2nb(us.nb4)
us.nb4 <- make.sym.nb(us.nb4)
us.wt4 <- nb2listw(us.nb4, style="W")

...您可以将其用于 Moran 特征向量过滤函数,以从(广义)线性模型的残差中消除空间自相关(如果您看到教程,它将是有意义的)。

同样的事情发生了,或者第一个问题。如果是分析我的工作。唯一的区别是我没有 xy 坐标..

但我想在二项式回归中包含空间依赖性......

我正在对正 /Negative 使用二项式回归模型,并使用 10 个自变量进行测试。数据没有 x 和 y 坐标,我想了解如何考虑空间自相关。

我已经研究了变量之间的相关性,并为 1500 个不同的样本运行了相同的模型(我有一个允许我这样做的大数据集)以了解每个参数的分布并检查可能在我的模型中引入问题的变量。

glm_model <- glm(PA ~ Var1 + Var2 + Var3 + Var4 + Var5,family=binomial(link=logit))

但是我相信我还需要考虑空间自相关。我看到有一个包可以帮助我(spdep),但是我不确定我是否完全理解我是否可以使用我的模型。我的问题是我有什么选择?