我正在使用 R 进行数据分析。R 提供了一个corr计算相关性的函数。这个函数提供了三种不同的方法/算法来估计,corr它们是 Pearson、Spearman 和 Kendall。我应该什么时候使用这些方法中的每一个?哪些因素决定了应该使用哪种方法?
我什么时候应该使用这些方法来计算相关性?
机器算法验证
相关性
r
2022-03-29 14:18:14
1个回答
皮尔逊积矩系数(皮尔逊参数)衡量变量之间的线性相关性。因此,当您怀疑的相关性是线性的时,它是合适的,可以用图表进行目视检查。
Kendall Tau 系数(kendall 参数)和 Spearman 相关系数(spearman 参数)是度量等级相关性。所以两个变量之间的相关性不需要是线性的。spearman 方法基本上是 pearson 方法,但应用于值的排名(值的排名由值排序后的位置给出)。kendal 方法基本上是作为一种统计量,以有序对的附加数量与对的总数之间的比率的形式构建。对于 kendal 方法,由于它是作为统计量构建的,因此可以在假设检验的框架中构建也使用它,具有所有好处(称为 tau 检验)。
所有这些方法都是用来推断随机变量之间依赖关系的工具。在 Wikipedia 专用页面上查看更多关于相关性和依赖性的信息