我有三个问题:
我们如何评估(或衡量)排名算法的性能?
对此是否有任何具体的衡量标准或绩效指标?
更具体地说,我们如何比较基于 AHP 的排名和概率排名算法的性能?
我有三个问题:
我们如何评估(或衡量)排名算法的性能?
对此是否有任何具体的衡量标准或绩效指标?
更具体地说,我们如何比较基于 AHP 的排名和概率排名算法的性能?
Kaggle 著名的国际象棋比赛评分 - Elo 与世界其他地区,旨在“发现其他方法是否可以比主力 Elo 评分系统更准确地预测国际象棋比赛的结果”,使用了这种结构
参赛者使用包含 8,631 名顶级选手的 65,000 多个近期结果的训练数据集来训练他们的评分系统。然后参与者使用他们的方法来预测另外 7,809 场比赛的结果
类似的结构——从完整的数据集开始,使用第一部分进行训练,最后一部分检查结果——可能有助于衡量排名算法的性能。