叶诗文奥运400m IM成绩统计是否“异常”?

机器算法验证 分布 统计学意义 异常值 生物统计学 方法
2022-04-03 10:35:38

2012年伦敦奥运会女子400米个人混合泳,16岁的中国游泳名将叶诗文以5秒多的成绩获得了金牌。她的表演受到了媒体的高度曝光和褒贬不一的评价,甚至引起了一些争议。例如,《自然》发表了一篇题为《奥运壮举为何引人怀疑——‘成绩剖析’有助于打消疑虑》的新闻报道,立即引起了极大关注和大量读者评论。

为了让自己更好地理解这个问题和练习,我尝试了一个“性能分析”,正如 Nature 新闻报道的副标题所说的那样。我所做的是分析 2011 年和 2012 年全球顶级游泳运动员在 400m IM 中的短期表现增长(或下降),并尝试看看叶诗文与其他优秀的表现改进者相比如何。我发现有超过 20 名游泳运动员可以说是比叶更好的成绩改进者。另外值得一提的是,叶璎珞在一个特别有趣的地方,她的表现介于大多数男性和大多数女性游泳运动员之间。考虑到她是该赛事的世界第一,这可能并不令人意外。见我的总结:http ://bit.ly/swimdata. 但我想知道这里的一些批评者是否可以“交叉验证”这种方法。在这种针对体育的“性能分析”中,尤其是对于叶案,应该检查哪些因素?

1个回答

在 1968 年墨西哥城的比赛中,鲍勃·比蒙以 29 英尺 2 英寸的距离打破了跳远的世界纪录,打破了当时低于 28 英尺的世界纪录。任何人都花了几十年的时间才接近并最终打破比蒙的记录。什么解释它?高海拔意味着稀薄的空气和较小的空气阻力。然而,那天没有其他人超过 28 英尺,包括 Beamon 的其他跳跃。没有人建议比蒙服用增强性能的药物。这是一个统计异常值。异常值发生。统计分析无法解释。但在你的情况下,你似乎采取了一种非常明智和务实的方法。您查看同一时间段内同一事件的相似表演者,发现许多人的最佳成绩比这位中国游泳运动员的表现要好得多。