概括
我在详细信息部分分享我的想法。我认为它们有助于确定我们真正想要实现的目标。
我认为这里的主要问题是您尚未定义等级相似性的含义。因此,没有人知道哪种方法可以更好地衡量等级之间的差异。
实际上,这让我们基于猜测模糊地选择一种方法。
我真正建议的是首先定义一个数学优化目标。只有这样,我们才能确定我们是否真的知道我们想要什么。
除非我们这样做,否则真的不知道我们想要什么。我们可能几乎知道我们想要什么,但几乎知道 \ know 。≠
我在Details中的文字本质上是朝着达到等级相似度的数学定义迈出的一步。一旦我们确定了这一点,我们就可以自信地继续选择衡量这种相似性的最佳方法。
细节
根据您的评论之一:
在严格解释目标的同时回答这个问题:
- 如果任何项目存在满足,则排名不同,其中是组中项目的排名,是同一项目的排名,但按组。i∈{1,2,…,25}iai≠biaiiabib
- 否则,排名没有什么不同。
但我不认为你真的想要那种严格的解释。因此,我认为您真正想说的是:
这里的一种解决方案是简单地测量最小编辑距离。即,需要对组的排序列表执行的最小编辑次数是多少,以使其与组的排序列表相同。ab
一次编辑可以定义为交换两个项目,并且花费点,具体取决于需要多少跳。因此,如果项目需要与项目和之间获得相同的等级),则此编辑的成本为。n13ab3
但是这种方法合适吗?为了回答这个问题,让我们更深入地看一下:
它没有标准化。如果我们说组的等级之间的距离是,而组的等级之间的距离是,这并不一定意味着比更相似彼此(也可能意味着对更大的项目集进行排名)。a,b3c,d123a,bc,dc,d
它假设每次编辑的成本与跳数成线性关系。这对我们的应用程序域来说是真的吗?会不会是逻辑关系更合适?还是指数型的?
它假定所有项目都同等重要。例如,排名项目(比如)中的分歧与排名项目(比如)中的分歧相同。在您的域中这是真的吗?例如,如果我们正在对书籍进行排名,那么不同意诸如 TAOCP 之类的著名书籍的排名,与不同意诸如TAOUP之类的糟糕书籍的排名同样重要吗?15
一旦我们解决了上述问题,并在两个等级之间达到了合适的相似性度量,我们就需要提出更多有趣的问题,例如:
- 组和组之间的差异只是由于随机机会造成的,那么观察到这种差异或更极端差异的概率是多少?ab