我可以在标准化变量之前测试变量之间的相关性吗?

机器算法验证 相关性 咕噜咕噜 标准化 生态
2022-03-10 03:33:58

我想做的是构建 GLMM 来评估资源选择,并且我有一组变量(一些代表距离,另一些代表土地覆盖的百分比)。

我可以在标准化变量之前测试变量之间的相关性吗?我不太确定我应该先做什么。

3个回答

我可以在标准化变量之前测试变量之间的相关性吗?我不太确定我应该先做什么。

无论您是在标准化之前还是之后计算相关性,相关性都是相同的。要看到这一点,只要知道相关性在尺度上是不变的就足够了。bRa>0, 然后

Corr(aXb,Y)=Cov(aXb,Y)Var(aXb)(Var(Y)=Cov(aX,Y)Var(aX)Var(Y)=aCov(X,Y)a2Var(X)Var(Y)=aCov(X,Y)aVar(X)Var(Y)=Cov(X,Y)Var(X)Var(Y)=Corr(X,Y)

第一个相等是一个定义。
第二个使用协方差和方差对位置偏移不变的属性。
第三个使用关于乘以常数的协方差和方差的属性。
第四个使用的事实是a>0.
第五个只是抵消了乘数。
第六个又是一个定义。

这包括标准化,即减去平均值并除以标准偏差(正数)。

是的,验证解释变量之间的相关性是 Zuur 等人建议的数据探索的一部分。(2010)避免常见统计问题的数据探索协议这应该在您标准化它们并构建您的 GLMM 之前完成。

但是,如果您首先标准化解释变量,我不确定它会如何影响相关性,但我猜相关性结果会相对相同。

对两个答案+1,但只是为了说明显而易见的:

线性相关定义为两个变量之间协方差的缩放版本。缩放本身只是两个变量标准差的乘积。因此,标准化(或为此检查的变量的任何线性变换)不会改变相关性,因为任何可能影响协方差的先前重新缩放效应将被给出最终相关性估计的尺度归一化所抵消。