对于情节 1,我可以通过做一个简单的相关来测试 x 和 y 之间的关联。
对于情节 2,关系是非线性的,但 x 和 y 之间有明确的关系,我如何测试关联并标记其性质?
对于情节 1,我可以通过做一个简单的相关来测试 x 和 y 之间的关联。
对于情节 2,关系是非线性的,但 x 和 y 之间有明确的关系,我如何测试关联并标记其性质?
...关系是非线性的,但 x 和 y 之间有明确的关系,我如何测试关联并标记其性质?
这样做的一种方法是适合作为半参数估计的函数例如,使用广义加性模型并测试该函数估计是否为常数,这表明两者之间没有关系和. 这种方法使您不必进行多项式回归,也不必有时对多项式的阶数做出任意决定等。
具体来说,如果您有观察结果,,您可以拟合模型:
并检验假设. 在R
中,您可以使用该gam()
函数执行此操作。如果y
是您的结果并且x
是您的预测器,您可以输入:
library(mgcv)
g <- gam(y ~ s(x))
打字summary(g)
会给你上面假设检验的结果。就描述关系的性质而言,最好用情节来完成。一种方法R
(假设上面的代码已经输入)
plot(g,scheme=2)
如果您的响应变量是离散的(例如二进制),您可以通过拟合逻辑 GAM 在此框架内适应它(在 中R
,您将添加family=binomial
到您的调用中gam
)。此外,如果您有多个预测变量,您可以包含多个加法项(或普通线性项),或拟合多变量函数,例如如果你有预测器x, z
。如果您使用默认方法,则通过交叉验证自动选择关系的复杂性,尽管这里有很大的灵活性 -如果有兴趣,请参阅gam
帮助文件。
如果非线性关系是单调秩相关(Spearman's rho)将是合适的。在您的示例中,有一个明显的小区域,其中曲线从单调递增变为单调递减,就像抛物线在一阶导数等于的点处所做的那样.
我想如果你有一些建模知识(除了经验信息之外)发生变化点的地方(比如) 然后您可以将相关性描述为正,并在集合上使用 Spearman 的 rho对在哪里提供该相关性的估计值,并使用 Spearman 相关性的另一个估计值其中相关性为负。这两个估计然后表征了之间的相关结构和并且与接近的相关性估计不同当使用所有数据进行估计时,这些估计值将很大且符号相反。
有些人可能会争辩说,只是经验信息(即观察到的对足以证明这一点。
您可以使用距离相关性测试来测试任何类型的依赖性。有关距离相关性的更多信息,请参见此处:了解距离相关性计算
这里是原始论文:https ://arxiv.org/pdf/0803.4101.pdf
在 R 中,这是在带有函数的energy
包中实现的。dcor.test
如果我的理解有误,请有人纠正我,但处理非线性变量的一种方法是使用线性近似。因此,例如,取指数分布的对数应该允许您将变量视为正态分布。然后可以像任何线性回归一样使用它来解决问题。