倾斜概率密度函数的“峰值”

机器算法验证 密度函数 描述性统计 偏度 峰度
2022-03-28 08:45:45

我想描述几个倾斜概率密度函数的“峰值”和尾部“沉重”。

我想描述的特征,它们会被称为“峰度”吗?我只看到用于对称分布的“峰度”一词?

4个回答

这里的主要问题是,什么是“峰值”?它是峰值的曲率(二阶导数?)它是否需要首先标准化?(你会这么认为,但是有一系列文献从 Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706 开始,它以具有较小方差的正常方式定义峰值更多“达到顶峰”)。还是像 Balanda 和 Macgillivray (The American Statistician, 1988, Vol 42, 111-119) 中所隐含的那样,概率集中在平均值的标准差内?一旦你确定了一个定义,那么应用它应该是微不足道的。但我会问,“你为什么在乎?” 无论定义如何,“峰值”有什么相关性?

顺便说一句,皮尔逊峰度仅测量尾部,不测量上述任何“峰度”定义。您可以根据需要在均值的标准差内更改数据或分布(保持均值 = 0 和方差 = 1 约束),但峰度只能在 0.25 的最大范围内变化(通常要小得多)。因此,您可以排除使用峰度来测量任何分布的峰度,即使峰度确实是任何分布的尾部度量,无论分布是对称、不对称、离散、连续、离散/连续混合还是经验。峰度测量所有分布的尾部,几乎没有关于峰值(无论如何定义)。

方差被定义为二阶矩μ2, 偏度被定义为三阶矩μ3峰度被定义为第四矩μ4,可以从数据中描述各种对称和非对称分布的属性。

这种技术最初是由Karl Pearson 在 1895 年为所谓的 Pearson Distributions I 到 VII 描述的。这已由 Egon S Pearson(日期不确定)于 1966 年在 Hahn 和 Shapiro 上发表,扩展到广泛的对称、不对称和重尾分布,包括 Uniform、Normal、Student-t、Lognormal、Exponential、Gamma、Beta、 Beta J 和 Beta U。来自 p 的图表。197 哈恩和夏皮罗,B1B2可用于建立偏度和峰度的描述符为:

μ3=B1 μ23
μ4=B2 μ22

如果您只想要简单的相对描述符,那么通过应用一个常量μ2=1偏度是B1峰度是B2.

我们试图在此处总结此图表以便对其进行编程,但最好在 Hahn 和 Shapiro 中查看它(第 42-49,122-132,197 页)。从某种意义上说,我们建议对 Pearson 图表进行一些逆向工程,但这可能是一种量化您正在寻找的东西的方法。

一种可能非常实用的方法是计算分布的生存函数的比率Pr(X~>1α)与正常的相比,显示它要大得多。另一种方法是计算百分位数的比率w1=x99~x50~x75~x50~分布的x~根据兴趣并将其与正常的一分位数值相除,w2=Φ99~Φ50~Φ75~Φ50~,τ=w1w2.

我不确定我是否理解你对尖峰和沉重的理解。Kurtosis 在德语中意为“过剩”,因此它描述了一个分布的“头部”或“峰值”,描述了它是非常宽还是非常窄。维基百科指出,“峰度”实际上是由“峰度”描述的,而峰度似乎不是一个真实的词,您应该使用“峰度”一词。

所以我认为你可能已经做对了,头部是峰度,尾部的“沉重”可能是偏度”:

这是你如何找到它的:

a3=Σi=1N(xix¯)3Nsx3

s 作为 x 的标准差。

这些值表明:

负偏斜:

a3<0

正偏斜:

a3>0

无歪斜

a3=0

您可以通过以下方式获得峰度值:

a4=Σi=1N(xix¯)4Nsx4

这些值表明:

桔梗:

a4<3

恙虫病:

a4>3

普通的:

a4=3.0

那有帮助吗?