与其他答案相反,我认为您可以根据可用数据对螺栓的能力发表一些看法。首先,让我们缩小你的问题。您问的是最快的人类,但由于男性和女性的跑步速度分布存在差异,最好的女性跑步者女性似乎比最好的男性跑步者稍慢,我们应该关注男性跑步者。为了获得一些数据,我们可以查看过去 45 年中 100 次跑步的最佳年份表现。关于这个数据有几点需要注意:
- 这些是最好的跑步时间,所以它们并没有告诉我们所有人类的能力,而是关于最低达到的速度。
- 我们假设这些数据反映了世界上最好的跑步者的样本。虽然可能发生了更好的跑步者没有参加锦标赛,但这种假设似乎是相当合理的。
首先,让我们讨论如何不分析这些数据。您可能会注意到,如果我们绘制运行时间与时间的关系图,我们会观察到强线性关系。

这可能会导致您使用线性回归来预测未来几年我们可以观察到多少更好的跑步者。然而,这将是一个非常糟糕的主意,这将不可避免地导致您得出结论,在大约两千年后,人类将能够在零秒内跑完 100 米,然后他们将开始实现负跑时!这显然是荒谬的,因为我们可以想象我们的能力存在某种生物和物理限制,这是我们所不知道的。
你怎么能分析这些数据?首先,请注意我们正在处理有关最小值的数据,因此我们应该为此类数据使用适当的模型。这导致我们考虑极值理论模型(参见例如Stuart Coles的《极值统计建模简介》一书)。您可以为此数据假设广义极值分布(GEV)。如果其中是独立且同分布的随机变量,则遵循 GEV 分布。如果您对建模最小值感兴趣,那么如果是最小值的样本,那么Y=max(X1,X2,…,Xn)X1,X2,…,XnYiZ1,Z2,…,Zk−Zi的最小值遵循 GEV 分布。因此,我们可以将 GEV 分布拟合到运行速度数据,从而得到非常好的拟合(见下文)。

如果您查看模型建议的累积分布,您会注意到 Usain Bolt 的最佳运行时间在最低1%分布的尾部。因此,如果我们坚持这些数据和这个玩具示例分析,我们会得出结论,更小的运行时间不太可能(但显然是可能的)。这种分析的明显问题是忽略了我们看到最佳运行时间逐年改进的事实。这让我们回到答案第一部分中描述的问题,即假设这里的回归模型是有风险的。可以改进的另一件事是,我们可以使用贝叶斯方法并假设信息先验,这将解释一些关于生理上可能的运行时间的数据外知识,这可能尚未观察到(但是,据我所知,目前未知)。最后,类似的极值理论已经用于体育研究,例如 Einmahl 和 Magnus (2008) 在通过极值理论论文记录田径运动。
你可以抗议说你没有问更快的跑步时间的概率,而是关于观察到更快的跑步者的概率。不幸的是,在这里我们不能做太多,因为我们不知道跑步者成为职业运动员的概率是多少,并且记录的跑步时间可供他使用。这不是随机发生的,有很多因素导致一些跑步者成为职业运动员,而另一些则不是(或者甚至有人喜欢跑步和跑步)。为此,我们必须有关于跑步者的详细人群数据,此外,由于您询问的是分布的极端情况,因此数据必须非常大。所以在这一点上,我同意其他答案。