为什么我们需要 Gumbel 分布?

机器算法验证 可能性 分布 口香糖分布
2022-03-25 06:49:52

我查看了维基百科上的Gumbel 分布文章,它说表示最大值的分布很有用。但它是如何工作的并不容易理解?详细的解释或示例可能会更有帮助。

我注意到分布的 pdf 非常接近指数分布,e(z+ez)和....相比ez? 我相信额外的术语可以带来一些有用的属性,但我确实知道它的具体优势,一个接近形式的 cdf?

1个回答

给定一个 iid 样本{X1,...,Xn},我们可以计算它的最大值Y=max{X1,...,Xn}. 问题是,如果样本的值遵循分布P(X),那么样本最大值P(Y)的分布是什么?

可以证明,根据极限的形式,的形式会发生变化。如果作为的幂律衰减,则是 Frechet 分布。逼近的有限端点,则它遵循 Weibull 分布,其参数可以很容易地写为样本大小的函数。如果比幂律衰减得更快,则是 Gumbel 分布(我不确定是否可以将其参数写为P(X)XinfP(Y)P(X)XinfP(Y)x0(x0x)αnP(X)P(Y)n与 Weibull 的情况一样)。这很重要,因为它显示了通用行为,即细节无关紧要,因此对于或任何其他形式都是相同的。重要的是它比幂律衰减得更快。您可以在本书第 24 页中看到它。另外,请注意,如果我们谈论的左尾而不是右尾的属性,这里对最大值的讨论也适用于最小值。exex2P(X)

但是,这些结果仅在无限样本量的限制下有效。如果您想获得有限的精确结果,您需要自己计算特定分布形式,如此处所示nP(Y)P(X)