序数回归和排名有什么区别?

机器算法验证 回归 序数数据 排行
2022-03-24 05:12:00

在序数回归和排名中,您都是从有序的因变量中学习的,所以我的问题是:

序数回归问题和学习排序问题之间的表述(如果有的话)有什么区别?

2个回答

3年后,我回答了我自己的问题。

对我来说,主要区别在于不同问题中模型的输出是什么。在序数回归中,任务是预测给定样本的标签,因此预测的输出是标签(例如在多类分类中就是这种情况)。另一方面,在学习排序问题中,输出是样本序列的顺序。也就是说,排序模型的输出可以看作是使样本具有尽可能有序的标签的排列。因此,与序数回归模型不同,排序算法无法预测类别标签。正因为如此,排序模型的输入不需要指定类标签,而只需要指定样本之间的部分顺序(参见例如 [0] 的应用)。从这个意义上说,排名是一个比序数回归更容易的问题:

用一个例子可以更好地解释这一点。假设我们有以下对 (sample, label):给定这个输入,排序模型将预测这个样本序列的顺序例如,对于排名算法,排列是具有满分的预测,因为两个序列的标签是有序的。另一方面,序数回归会为每个样本预测一个标签,在这种情况下,预测 (1, 2, 2) 会给出一个完美的分数,但不是 (1, 2, 3) 或 (1, 3、2)。{(x1,1),(x2,2),(x3,2)}(1,2,3)(1,2,3)(1,2,3)(1,3,2){(x1,1),(x2,2),(x3,2)}{(x1,1),(x3,2),(x2,2)}

[0] 使用点击数据优化搜索引擎 Thorsten Joachims

这是一个很好的问题!一般来说,统计学和机器学习之间的区别或其他领域解决“我们的”问题的方法可能很难理解,因为每个领域都有大量的术语。

因此,例如,当人们发现反向传播神经网络“只是”进行某种非线性回归时,这就像研究人员的一个重大发现。

我认为这是同一类事情:人们想出很多技术来解决同样的问题。序数逻辑就是其中之一。