nDCG 和秩相关方法有什么区别?

数据挖掘 排行 学习排名 ndcg
2022-03-13 01:43:40

我们什么时候使用其中一个?

我的用例:

我想评估一个线性空间,看看检索结果有多好。我有一组数据 X (mxn) 和一些权重 W (mx 1)。我想用地面真值 Y 测量 W'X 上的最近邻检索性能。这是一个连续值,所以我不能使用简单的精度/召回率。

如果我使用排名相关,我会发现检索到的 Ys 和检索排名之间的相关性。如果我使用 nDCG,我将使用排序后的 Y 来计算 IDCG。

我想将此与我更改 Y 时得到的相关值进行比较。(例如,Y 在一种情况下可能是头部姿势角度,在另一种情况下可能是年龄)

1个回答

排名中的一个核心问题是设计评估排名函数的度量。本文中,我们从理论的角度研究了归一化折扣累积增益 (NDCG),它是在实践中广泛使用的一系列排名度量。尽管对 NDCG 家族进行了广泛的实证研究,但对其理论性质知之甚少

与许多其他措施相比,NDCG 有两个优点。首先,NDCG 允许每个检索到的文档具有分级相关性,而大多数传统的排名度量只允许二元相关性。... 其次,NDCG 涉及排名上的折扣函数,而许多其他指标统一加权所有职位。

更多:理论和数学信息