排名相关统计比较
机器算法验证
鹏
斯皮尔曼罗
肯德尔陶
基尼
2022-04-02 14:47:40
1个回答
提出的问题相当复杂。正如分析师已经指出的那样,我认为所有这些度量都不能直接比较,因为秩相关系数、基尼系数和 AUC(ROC 曲线下的面积)通常在不同的域上定义。
然而,Kendall 之间的关系非常密切。和斯皮尔曼的,列表中的两个秩相关系数。虽然提到的论文 cohoz已经通过经验证明了它们的关系(图 3),但这种关系实际上可以在理论上进行量化。让和是两个排名,并且和成为项目的行列在和, 分别。肯德尔距离和斯皮尔曼距离和定义如下:
我们之间有以下关系和遵循[Diaconis 和 Graham 1977]:
因为等级相关系数只是等级距离到区间的归一化, 类似的不等式可以很容易地在和. 在统计排名文献中,结果主要以距离而不是系数来表示。
还有两件事:
- 排名和必须是完整的排名才能使这种不等式成立。也就是说,它们不能是部分排名。
- 如果有人感兴趣和不仅在排名上而且在连续随机变量上定义,情况更加复杂。这是Fredicks 和 Nelsen的相关论文。
其它你可能感兴趣的问题