两种一级方程式资格赛形式的统计变化

机器算法验证 方差
2022-01-30 05:20:27

我刚刚阅读了BBC 这篇关于 F1 排位赛格式的文章。

组织者希望降低排位赛的可预测性,即增加结果的统计差异。忽略一些无关紧要的细节,目前车手们在两次尝试中(具体而言)按他们最好的单圈排名。

一位 F1 负责人让·托德 (Jean Todt) 提出,按平均两圈对车手进行排名会增加统计差异,因为车手犯错的可能性可能会增加一倍。其他消息来源认为,任何平均值肯定会减少统计变化。

在合理的假设下,我们能说谁是对的吗?我想它归结为的相对方差,其中是代表驾驶员两次单圈时间的随机变量?mean(x,y)min(x,y)xy

4个回答

我认为这取决于单圈时间的分布。

独立同分布。X,Y

  1. 如果,则P(X=0)=P(X=1)=12Var(X+Y2)=18<Var(min(X,Y))=316.
  2. 然而,如果P(X=0)=0.9,P(X=100)=0.1,则 Var(X+Y2)=450>Var(min(X,Y))=99.

这与问题中提到的关于犯错的论点一致(即以很小的概率运行异常长时间)。因此,我们必须知道单圈时间的分布才能做出决定。

不失一般性,假设并且两个变量均来自具有特定均值和方差的相同分布。yx

{y,x}进行了改进,{x}

案例1,意思是: yx2

案例 2,最小值:yx

因此,平均值对改进的影响(由方差驱动)是取最小值(对于 2 次试验)的一半。也就是说,均值抑制了可变性。

这是我对 Var[Mean] 的证明

对于 2 个随机变量 x,y,它们的平均值与最大值和最小值之间存在关系。

2Mean(x,y)=Min(x,y)+Max(x,y)
因此 如果我们现在假设分布围绕均值对称,则 因此 也容易从这个推导中可以看出,为了扭转这种不等式,您需要一个分布在均值的负值侧非常锐利地截断分布。例如,对于指数分布,均值的方差大于最小值。
4Var[Mean]=Var[Min]+Var[Max]+2Cov[Min,Max]
Var[Min(x,y)]=Var[Max(x,y)]
4Var[Mean]=2Var[Min]+2Cov[Min,Max]
Cov[Min,Max]<=sqrt(Var[Min]Var[Max])=Var[Min]
Var[Mean]<=Var[Min]

好问题,谢谢!我同意@sandris 的观点,即单圈时间的分布很重要,但我想强调需要解决问题的因果方面。我的猜测是,F1 希望避免同一支车队或车手年复一年地主宰这项运动的无聊局面,他们特别希望引入(创收!)真正的可能性,即“热门”新车手可以运动中突然兴起。

也就是说,我的猜测是,有一些希望可以破坏过于稳定的车队/车手排名。(考虑模拟退火中提高温度的类比。)然后问题就变成了,起作用的因果因素是什么,以及它们如何分布在所有车手/车队中,从而为当前的老牌车队创造持久的优势。(考虑征收高额遗产税以在整个社会中“公平竞争”的类似问题。)

假设现有车队通过严重依赖驾驶员经验的保守策略来维持现有车队,该策略强调单圈时间的低差异,以牺牲平均单圈时间为代价。假设与(比方说)年轻车手形成鲜明对比,他们必然会采用更具侵略性(高风险)的策略,但差异更大,但这涉及一些壮观的驾驶,有时“恰到好处”并实现惊人的单圈时间。抛开安全问题,F1 显然希望在比赛中看到一些这样的“弱者”。在这种因果情景中,似乎最好的 n 圈政策(大)将有助于提升新贵——假设有经验的司机“以他们的方式设置”,所以不能n

另一方面,假设发动机故障是一个不可控制的事件,所有车队的概率相同,并且当前的排名正确地反映了车手/车队质量在许多其他因素上的真实等级。在这种情况下,引擎故障带来的厄运有望成为 F1 可以利用以实现更大机会均等的唯一“平衡因素”——至少在没有破坏“竞争”外观的严厉排名操纵的情况下。在这种情况下,一项严重惩罚发动机故障的政策(这是这种情况下唯一不利于现有企业的因素)有望促进排名的不稳定性。在这种情况下,上面提到的 best-of-n 策略将是完全错误的策略。