学习排名:使用成对排名方法构建绝对排名

数据挖掘 信息检索 排行
2022-02-19 16:35:02

我正在学习学习排名的“成对方法”。据我了解,训练输出是部分排序函数r那:

  • 给定一些查询q和两个文件didj
  • 预测是否
    r(di)>r(dj)
    或不

但是,要使 IR 系统正常工作,排名应该是绝对的。

接下来的自然问题是如何仅使用以下输出的部分秩来构造绝对秩r?

但部分排名并不能保证绝对排名。例如

r(x)>r(y),r(y)>r(z),r(z)>r(x)
给出一个循环。

我想我误解了成对方法如何适用于 IR 系统。谁能纠正我?

1个回答

从不一定遵循公理或理性偏好的成对比较创建总排名肯定需要一些优化,并且您需要计算此类比较的二次数才能产生排名。

然而,有一个技巧可以轻松做到这一点:如果分类一个元素是否排在另一个之上的函数在所有特征中都是线性的,那么您可以直观地将每个元素与一个空元素进行比较(即只需将决策函数应用于单独的元素),获得分配给它们的分数,并按此分数对它们进行排序。

所以,直观地说,你的线性分类器应该是这样的:元素 1 高于元素 2 如果: F(el1 – el2)>0 [函数必须是对称的,因此不能有非零阈值] - > F(el1) – F(el2) >0 (仅当 F 为线性时!!!)这意味着 el1 > el2 当且仅当 F(el1)>F(el2)