比赛数据统计分析

机器算法验证 假设检验 非参数
2022-03-19 03:04:04

我正在比较参加锦标赛的两个小组的分数,有人告诉我,比较需要 Mann-Whitney U 检验。不过,我觉得这是不对的:我的两组分数基本上是相互依赖的,因为这两组是相互竞争的。

简而言之:我有两组,对照组 A(n=10 名男性)和实验组 B(n=12 名男性)。B组接受了治疗,然后A组和B组的成员在锦标赛中相互对抗。我对 A 与 B 成功击败他们竞争的对立组的人的程度感兴趣。

在比赛的每一天,两个 A 和两个 B 参加比赛。每场比赛都是每个人都为自己争取积分(我认为任务无关紧要)。在一天之内,总是有 4 个竞争者——2 个 A 和 2 个 B。但是,如果那天其中任何一个人达到了标准(基本上得分一定数量),他就会被拉下并在第二天用来自同一家庭组(A或B)的新球员替换。一个人最多可以在 7 天内达到标准(如果您连续 7 天未达到标准,您将被视为输球,并退出比赛)。这意味着一个人(例如,一个 A)在一天内比赛并获胜,只面对三个其他竞争对手 - 1 个 A 和 2 个 B。但是一个表现不佳并停留 7 天的 A 可能会面对更多的玩家——一堆 A 和 B

所以我给每个男人一个排名分数,反映他击败的相反组男人的百分比。假设一个名叫 Joe 的 A 参加了两天的比赛,面对另外 1 个 A 和 3 个 B,他排在第二位,排在小组中的另一个 A 之后,但高于三个 B。他的分数是1.0。如果乔经历了更艰难的时期并且需要更多的时间来达到标准,他可能会面临更多的竞争对手,但如果他超过了他遇到的所有 B,他的分数仍然是 1.0。该分数试图衡量球员在击败异类男子方面的效率,并允许在面对不同数量竞争对手的男子之间进行比较。

所以两组的排名分数如下所示:

答:1、1、1、0.833333、0.75、0.833333、0.5、0.333333、0.333333、0.5、0.333333、0.125

B:1、0.5、0.666667、0.5、0.333333、0.5、0.5、0.2、0.166667、0

我的问题是:有没有比 Mann-Whitney 更有效的方法来查看组之间是否存在差异?

1个回答

的。这种情况如此复杂,结果如此相互依存,以至于几乎所有标准测试的适用性都受到质疑。

为什么不进行置换测试这是它的自然情况:没有治疗效果的零假设基本上说标签是没有意义的。因此,保留所有结果但置换标签,始终保持一组 10 个“对照”和一组 12 个“治疗”对象。 = 646,646 排列中的每一个有意义的组之间的任何排名或相对分数。(您可以对排列进行随机抽样以节省时间,但它们的数量足够小,可以很容易地进行这种蛮力计算。)这就是在零假设下您的统计数据的排列分布。要确定 p 值,请查看统计量的观察值落在累积分布上的位置。(2210)

顺便说一句,如果不是随机选择男性参加比赛(正式地 - 不是任意地 - 使用随机数生成器),那么人们可能会怀疑任何明显的差异可能是由于男性参加比赛的顺序造成的。如果存在这种缺陷,任何统计检验都无法克服。