Stats noob 正在研究一种用于在锦标赛中对玩家进行排名的算法。
我有一组测试玩家,每个玩家都有一个“技能”值。我的算法模拟了一场“锦标赛”,其中玩家以某种顺序(例如瑞士配对)相互对抗(1v1)。在比赛结束时,我有每个玩家的排名。
例如,样本数据集可能类似于:
Name | Tournament Rank | "True" Rank
Alex | 5 | 7
John | 1 | 2
Mike | 3 | 1
...
所以约翰赢得了比赛,尽管他是那里的第二好球员,而迈克实际上是最好的球员,但由于运气或其他原因碰巧获得了第三名。
考虑到每个玩家的“真实”技能和他们在锦标赛中的排名,我如何才能最好地量化我的锦标赛算法在对每个人进行排名时的表现如何?例如,我希望能够说出诸如“使用这组输入参数,我的锦标赛模拟器比使用其他输入参数集更准确地放置人员 10%”之类的话
(奖金问题:)
此外,对我来说,可以说比确切排名更重要的是玩家处于正确的玩家“桶”中。例如,如果我将结果分成 5 个部分(前 20%、第 60-80 个百分位数等),我需要我的锦标赛算法来可靠地将人们放入他们应得的存储桶中。你会做不同的事情吗?比上面检查人们如何最终进入桶的正确性?