相关性是否等同于关联?

机器算法验证 相关性 术语 非独立的
2022-01-28 05:13:05

我的统计学教授声称,“相关”一词严格适用于变量之间的线性关系,而“关联”一词广泛适用于任何类型的关系。换句话说,他声称“非线性相关”一词是矛盾的。

根据我在维基百科关于“相关性和依赖性”的文章中的这一部分,皮尔逊相关系数描述了两个变量之间关系的“线性”程度。这表明术语“相关性”实际上只适用于线性关系。

另一方面,在 Google 上快速搜索“非线性相关”会发现许多使用该术语的已发表论文。

我的教授是正确的,还是“相关”只是“关联”的同义词?

4个回答

不; 相关不等于关联。但是,相关性的含义取决于上下文。

经典统计定义是,引用科茨和约翰逊的统计科学百科全书“两个随机变量之间线性关系强度的度量”。在数理统计中,“相关性”似乎通常具有这种解释。

在数据通常是序数而不是数字的应用领域(例如,心理测量学和市场研究),这个定义没有那么有用,因为线性概念假设数据具有区间尺度特性。因此,在这些字段中,相关性被解释为指示单调递增或递减的双变量模式或等级的相关性。已经为此专门开发了许多非参数相关统计(例如,Spearman 相关和 Kendall tau-b)。这些有时被称为“非线性相关”,因为它们是不假设线性的相关统计。

在非统计学家中,相关性通常意味着关联(有时有因果关系,有时没有因果关系)。不管相关性的词源如何,现实情况是,在非统计学家中,它具有更广泛的含义,再多的责备他们不恰当的使用可能会改变这一点。我做了一个“谷歌”,似乎非线性相关的某些用途似乎属于这种(特别是,似乎有些人使用该术语来表示数值变量之间的平滑非线性关系) .

术语“非线性相关”的上下文相关性质可能意味着它是模棱两可的,不应使用。至于“相关性”,您需要弄清楚使用该术语的人的上下文,以便了解他们的意思。

我认为试图解开“相关”和“关联”这两个术语没有多大意义。毕竟,皮尔逊本人(和其他人)开发了一种非线性关系的度量,他们将其命名为“相关比率”。

似乎对联想有误解。关联度量(效应大小)是定量分析所固有的,而不是定性分析。

我想说,相关性适用于定量数据和与定性数据的关联,两者都没有必然的因果关系。