极端事件的幂律分布是否像正态分布一样特殊?

机器算法验证 分布 极值 峰度
2022-03-21 07:39:47

幂律分布在维基百科文章中定义如下

肥尾的最极端情况是由尾部像幂律一样衰减的分布给出的。

Pr[X>x]xα  as  x,  α>0

很小,则称该分布有一个肥尾。α

我阅读了许多关于幂律分布的文章来解释极端事件。尤其是幂律分布在金融和经济中无处不在。

我知道由于中心极限定理(CLT),正态分布无处不在。由许多随机子效应组成的组合效应可能遵循 CLT 的正态分布。但是,我不知道幂律分布是否有像 CLT 这样的通用定理。

当决定发生极端事件时,大自然似乎倾向于幂律。幂律分布是否像 CLT 一样特殊?或者幂律只是一个人为的、方便的概念来逼近不是幂律的真实分布?

2个回答

关于第一个问题,是否存在导致幂律分布的收敛定理,应该提到极值类型定理(Fisher and Tippett, 1928 , Gnedenko 1934),导致三个最大稳定极值分布(Type I 到 III,也称为 Gumbel、Fréchet 和 Weibull 分布)。的 Fréchet 分布或广义极值 (GEV) 分布ξ>0特点是尾巴肥大。例如 Cauchy、Student 或 Pareto(幂律)分布的长(渐近)序列的最大值是 Fréchet 分布,并且还可以证明 Fréchet 分布是所谓的高斯分布最大值倒数第二个分布,尽管后者是渐近 Gumbel(轻尾)分布的。所以有一个与幂律分布有关的一般定理。

关于第二个问题,我可以向您指出 Didier Sornette 教授的著作《自然科学中的关键现象》,他在书中从统计物理学中为肥尾自然现象提供了广泛的动力。

PS:这是我在 StackExchange 网站上的第一个回答,如果您有提示或批评,我很高兴收到反馈!

首先,重尾/帕累托分布(又名幂律)经常出现在金融和经济之外。它们用于描述无数自然现象的大小/高度/大小/严重程度分布。
一些例子是海浪、火山爆发、小行星撞击(一个众所周知的例子是月球上陨石坑的大小)、龙卷风、森林火灾、溪流和洪水、太阳耀斑、山体滑坡、降雨……其他有趣的人类-相关的例子是人类住区的大小,在网络上传输的文件的大小,谷歌的网页的 PageRank 数量......

这与极值分析领域(百年洪水、流氓海浪……)密切相关- 请参阅 Joel 列出的一些著名极值分布的答案。

还需要注意的是,上述现象的经验分布(直方图,KDE)是重尾的。换句话说,我们已经观察到这些现象中自然出现的幂律。所以是的,我们确实使用参数模型来近似自然发生的分布、模拟值等,但我认为我们不能说它是人为的。(Sycorax 在上面的评论中链接到的论文Clauset 等人 2009在这里似乎是一个很好的参考。)

其次,就您的问题而言,虽然经常观察到幂律分布,但它们产生的潜在物理过程仍然大多是未知的。事实上,自然现象是复杂的。例如,洪水是由气象和水文过程相互作用产生的,但也受到基础设施(如水坝)和人类活动(如土地利用)的影响。然而,有许多潜在的过程被认为会在自然和其他与人类相关的现象的分布中产生肥尾,例如:

参考

纽曼,马克 EJ。“幂律、帕累托分布和齐夫定律。” 当代物理学 46.5 (2005): 323-351。

El Adlouni, S.、B. Bobée 和 TBMJ Ouarda。“在水文极端事件分布的尾部。” 水文杂志 355.1-4 (2008): 16-33。

米岑马赫,迈克尔。“幂律和对数正态分布的生成模型简史。” 互联网数学 1.2(2004 年):226-251。

Clauset、Aaron、Cosma Rohilla Shalizi 和 Mark EJ Newman。“经验数据中的幂律分布。” 暹罗评论 51.4 (2009): 661-703。