分布的峰度与密度函数的几何形状有何关系?

机器算法验证 峰度 几何学
2022-02-03 13:37:17

峰度用于测量分布的峰度和平坦度。分布的密度函数,如果存在的话,可以看作是一条曲线,并具有与其形状相关的几何特征(如曲率、凸度等)。

所以我想知道一个分布的峰度是否与密度函数的一些几何特征有关,这可以解释峰度的几何意义?

4个回答

连续分布的矩以及它们的函数(如峰态)对它的密度函数图几乎没有什么影响。

例如,考虑以下图表。

在此处输入图像描述

的非负函数的图:它们都是 PDF。此外,它们都有完全相同的时刻——每一个最后的无限数量。因此,它们共享一个共同的峰度(恰好等于。)13+3e2+2e3+e4

这些函数的公式是

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

对于x>0, 1s1,kZ.

该图在左侧的值,在顶部左列显示标准对数正态分布的 PDF。sk

Kendall 的高级统计理论(Stuart & Ord,第 5 版)中的练习 6.21要求读者证明这些都有相同的时刻。

人们可以类似地修改任何pdf 以创建另一个形状完全不同但具有相同的第二和第四中心矩(例如)的 pdf,因此具有相同的峰度。仅从这个例子就应该非常清楚,峰度不是对称、单峰、双峰、凸度或任何其他熟悉的曲线几何特征的易于解释或直观的度量。

因此,矩函数(以及作为特例的峰度)不描述 pdf 图形的几何特性。这在直觉上是有道理的:因为 pdf 通过面积表示概率,我们几乎可以自由地将概率密度从一个位置转移到另一个位置,从根本上改变 pdf 的外观,同时固定任何有限数量的预先指定的矩。

[注意,这是针对现场另一个问题而写的;答案已合并到当前问题。这就是为什么这个答案似乎回应了一个措辞不同的问题。然而,这篇文章的大部分内容都应该与这里相关。]

峰度并不能真正衡量分布的形状。也许在某些分布族中,您可以说它描述了形状,但更一般地说,峰度并不能告诉您太多关于实际形状的信息。形状受到许多因素的影响,包括与峰度无关的因素。

如果一个图像搜索峰度,就会出现很多这样的图像:

p

相反,它似乎显示出变化的方差,而不是增加峰度。为了比较,这是我刚刚绘制的三个正常密度(使用 R),具有不同的标准偏差:

在此处输入图像描述

如您所见,它看起来与上一张图片几乎相同。这些都具有完全相同的峰度。相比之下,这里的示例可能更接近图表的目标

在此处输入图像描述

绿色曲线更尖且尾部更重(尽管此显示不太适合查看尾部实际重多少)。蓝色曲线的尖峰较少,尾巴很轻(实际上它根本没有尾巴6均值的标准差)。

这通常是人们谈论表示密度形状的峰度时的意思。然而,峰态可能是微妙的——它不必像那样工作。

例如,在给定的方差下,较高的峰度实际上可能会以较低的峰值出现。

还必须注意零超峰度意味着正常的诱惑(并且在很多书中公开声明)。有些分布的峰度为 0,与正常情况完全不同。这是一个例子:

dgam 2.3

确实,这也说明了前一点。我可以很容易地构建一个类似的分布,其峰度比正常值高,但在中心仍然为零 - 完全没有峰值。

网站上有许多帖子进一步描述了峰态。一个例子是here

对于对称分布(即偶数中心矩有意义的分布),峰度测量基础 pdf 的几何特征。峰度测量(或通常相关)分布的峰值是不正确的。相反,峰度测量基础分布与对称 双峰的距离(代数上,完美对称和双峰分布的峰度为 1,这是峰度可能具有的最小可能值)[0]。

简而言之[1],如果您定义:

k=E(xμ)4/σ4

E(X)=μ,V(X)=σ2, 然后

k=V(Z2)+11

为了Z=(Xμ)/σ.

这意味着k可以看作是分散度的度量Z2围绕它的期望 1。换句话说,如果你对方差和期望有几何解释,那么峰态就会随之而来。

[0] RB 达灵顿 (1970)。峰度真的是“峰值”吗?美国统计学家,卷。24 号,第 2 号。

[1] JJA Moors (1986). 峰度的意义:重新审视达林顿。美国统计学家,第 40 卷,第 4 期。

另一种答案:我们可以使用来自http://www.quantdec.com/envstats/notes/class_06/properties.htm的想法以几何方式说明峰态:图形时刻。

从峰度的定义开始:

k=E(Xμσ)4=(xμσ)4f(x)dx
在哪里f是密度X,μ,σ2分别是期望和方差。积分符号下的非负函数积分到峰度,并从周围对峰度做出贡献x. 我们可以将其称为峰态密度,并将其绘制成图形显示峰态。(请注意,在这篇文章中,我们没有使用过度峰度 ke=k3完全)。

在下文中,我将展示一些对称分布的图形峰度图,所有分布均以零为中心并缩放为方差为 1。

一些对称分布的视觉峰度

请注意,中心对峰度的贡献实际上不存在,表明峰度与“峰度”没有太大关系。