Goodman-Kruskal gamma 和 Kendall tau 或 Spearman rho 相关性如何比较?

机器算法验证 斯皮尔曼罗 肯德尔陶 古德曼克鲁斯卡尔伽玛
2022-01-22 22:46:08

在我的工作中,我们将某些数据集的预测排名与真实排名进行比较。直到最近,我们一直在单独使用 Kendall-Tau。一个从事类似项目的小组建议我们尝试使用Goodman-Kruskal Gamma,他们更喜欢它。我想知道不同等级相关算法之间的区别是什么。

我找到的最好的答案是这个答案,它声称使用 Spearman 代替通常的线性相关,并且 Kendall-Tau 不那么直接,更类似于 Goodman-Kruskal Gamma。我正在使用的数据似乎没有任何明显的线性相关性,并且数据严重偏斜且不正常。

此外,对于我们的数据,Spearman 通常比 Kendall-Tau 报告更高的相关性,我想知道这对数据的具体说明是什么。我不是统计学家,所以我正在阅读的一些关于这些事情的论文对我来说似乎是行话,抱歉。

3个回答

Spearman rho vs Kendall tau这两者在计算上是如此不同,以至于您无法直接比较它们的大小。Spearman 通常高出 1/4 到 1/3,这使得人们错误地得出结论,Spearman 对于特定数据集“更好”。rho 和 tau 之间的区别在于它们的意识形态、rho的方差比例和 tau 的概率Rho 是应用于排名数据的常用 Pearson r,并且与 r 一样,对具有大矩的点(即与云中心的偏差)比对具有小矩的点更敏感。因此rho对排序后的云形状相当敏感完成:长方形菱形云的系数将高于长方形哑铃云的系数(因为第一个菱形云的锐边是大矩)。Tau 是 Gamma 的扩展,对所有数据点同样敏感,因此对排序云形状的特殊性不太敏感。Tau 比 rho 更“一般”,因为只有当您认为变量之间的潜在(模型或总体函数)关系是严格单调的时,rho 才被保证。虽然 Tau 允许非单调的基础曲线和测量单调“趋势”,无论是正面还是负面,总体上占主导地位。Rho 在大小上与 r 相当;tau 不是。

Kendall tau 饰演 GammaTau 只是 Gamma 的一种标准化形式。几个相关的度量都有分子,但在归一化分母方面不同:PQ

  • 伽玛:P+Q
  • Somers 的 D("x 依赖"):P+Q+Tx
  • Somers' D("y 依赖"):P+Q+Ty
  • Somers' D("symmetric"):以上两者的算术平均值
  • 肯德尔的 Tau-b corr。(最适合方桌):这两个的几何平均值
  • 肯德尔的 Tau-c corr。(最适合长方形桌子):N2(k1)/(2k)
  • 肯德尔的 Tau-a corr。(对平局进行 nо 调整):N(N1)/2=P+Q+Tx+Ty+Txy

其中 - 具有“一致性”的观测对数, - 具有“反演”; - 变量 X 的关系数, - 变量 Y, - 两个变量; - 观察的数量, - 该数量较少的变量中不同值的数量。PQTxTyTxyNk

因此,tau 在理论上和大小上与 Gamma 直接可比。Rho 在理论和量级上与 Pearson直接可比。Nick Stauner 在这里的好回答告诉我们如何间接比较 rho 和 tau 。r

另请参阅tau 和 rho。

以下是 Andrew Gilpin (1993) 的一句话,出于理论上的原因,优于 Spearman 的τρ

[Kendall 的更快地接近正态分布,因为增加;并且在数学上也更容易处理,特别是当存在关系时。 τρNτ

,我不能多加补充,除了在我最近使用的调查数据样本中,它似乎产生的估计值比 Kendall 的略大……当然,值得注意的是低于 Spearman 的估计值。然而,我也尝试计算几个部分估计值(Foraita & Sobotka, 2012),结果更接近于部分而不是部分 ......不过,这需要相当长的处理时间,所以我会离开模拟测试或与其他人的数学比较......(谁知道如何做......)γτργρτ

正如ttnphns所暗示的那样,您不能得出结论,仅就幅度而言,您的估计值优于估计值,因为它们的尺度不同(即使限制没有)。的比率描述为在大多数值范围内大约为 1.5。随着大小的增加,它们逐渐接近,因此当两者都接近 1(或 -1)时,差异变得无穷小。Gilpin 给出了一个很好的大表,其中包含d的第三位数字ρτρτρrr2Zrτ在其范围内每增加 0.01,就像您期望在介绍统计教科书的封面内看到的一样。他将这些值基于肯德尔的特定公式,如下所示: 从吉尔平写作的形式,这是根据皮尔逊的。)

r=sin(τπ2)ρ=6π(τarcsin(sin(τπ2)2))
ρr

也许将您的转换为τρ并查看计算变化如何影响您的效果大小估计是有意义的。似乎这种比较可以表明 Spearman 的对您的数据更敏感的问题在多大程度上存在于您的数据中(如果有的话)。肯定存在更直接的方法来单独识别每个特定问题。我的建议会为这些问题产生更多的快速和肮脏的综合效果。如果没有差异(在校正尺度差异之后),那么人们可能会争辩说没有必要进一步寻找仅适用于ρρ. 如果有很大的不同,那么可能是时候打开放大镜来确定是什么原因了。

我不确定人们在使用 Kendall 的时通常如何报告效应大小(不幸的是,人们普遍担心报告效应大小的程度有限),但因为似乎不熟悉的读者可能会尝试按照 Pearson 的规模来解释它,使用上面的转换公式报告您的统计量及其在 r 的比例上的影响大小是明智的......或者至少指出比例的差异并向 Gilpin 大喊他方便的转换表.τrτr

参考

Foraita, R. 和 Sobotka, F. (2012)。验证图形模型。 gmvalid 包,v1.23。 综合 R 档案网络。网址:http ://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

吉尔平,AR (1993)。Kendall 的 Tau 到 Spearman 的 Rho 的转换表,在荟萃分析的影响幅度测量的范围内。 教育和心理测量,53 (1), 87-92。

肯德尔,MG (1962)。 等级相关方法(第 3 版)。伦敦:格里芬。

这些都是单调联想的好指标。Spearman 的与随机三元组观察中的多数一致性概率有关,而 (Kendall) 和 (Goodman-Kruskal) 与成对一致性有关。的主要决定是您是否要惩罚和/或的关系。 不会惩罚两者中的平局,因此比较在预测中的预测能力不会奖励ρτγγτXYγX1X2YXs 表示更连续。这种缺乏奖励使得它与基于模型的似然比测试有点不一致。一个(比如二进制)可以有很高的XXγ