我想描述几个倾斜概率密度函数的“峰值”和尾部“沉重”。
我想描述的特征,它们会被称为“峰度”吗?我只看到用于对称分布的“峰度”一词?
我想描述几个倾斜概率密度函数的“峰值”和尾部“沉重”。
我想描述的特征,它们会被称为“峰度”吗?我只看到用于对称分布的“峰度”一词?
这里的主要问题是,什么是“峰值”?它是峰值的曲率(二阶导数?)它是否需要首先标准化?(你会这么认为,但是有一系列文献从 Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706 开始,它以具有较小方差的正常方式定义峰值更多“达到顶峰”)。还是像 Balanda 和 Macgillivray (The American Statistician, 1988, Vol 42, 111-119) 中所隐含的那样,概率集中在平均值的标准差内?一旦你确定了一个定义,那么应用它应该是微不足道的。但我会问,“你为什么在乎?” 无论定义如何,“峰值”有什么相关性?
顺便说一句,皮尔逊峰度仅测量尾部,不测量上述任何“峰度”定义。您可以根据需要在均值的标准差内更改数据或分布(保持均值 = 0 和方差 = 1 约束),但峰度只能在 0.25 的最大范围内变化(通常要小得多)。因此,您可以排除使用峰度来测量任何分布的峰度,即使峰度确实是任何分布的尾部度量,无论分布是对称、不对称、离散、连续、离散/连续混合还是经验。峰度测量所有分布的尾部,几乎没有关于峰值(无论如何定义)。
方差被定义为二阶矩, 偏度被定义为三阶矩峰度被定义为第四矩,可以从数据中描述各种对称和非对称分布的属性。
这种技术最初是由Karl Pearson 在 1895 年为所谓的 Pearson Distributions I 到 VII 描述的。这已由 Egon S Pearson(日期不确定)于 1966 年在 Hahn 和 Shapiro 上发表,扩展到广泛的对称、不对称和重尾分布,包括 Uniform、Normal、Student-t、Lognormal、Exponential、Gamma、Beta、 Beta J 和 Beta U。来自 p 的图表。197 哈恩和夏皮罗,和可用于建立偏度和峰度的描述符为:
如果您只想要简单的相对描述符,那么通过应用一个常量偏度是峰度是.
我们试图在此处总结此图表以便对其进行编程,但最好在 Hahn 和 Shapiro 中查看它(第 42-49,122-132,197 页)。从某种意义上说,我们建议对 Pearson 图表进行一些逆向工程,但这可能是一种量化您正在寻找的东西的方法。
一种可能非常实用的方法是计算分布的生存函数的比率与正常的相比,显示它要大得多。另一种方法是计算百分位数的比率分布的根据兴趣并将其与正常的一分位数值相除,,.
我不确定我是否理解你对尖峰和沉重的理解。Kurtosis 在德语中意为“过剩”,因此它描述了一个分布的“头部”或“峰值”,描述了它是非常宽还是非常窄。维基百科指出,“峰度”实际上是由“峰度”描述的,而峰度似乎不是一个真实的词,您应该使用“峰度”一词。
所以我认为你可能已经做对了,头部是峰度,尾部的“沉重”可能是偏度”:
这是你如何找到它的:
s 作为 x 的标准差。
这些值表明:
负偏斜:
正偏斜:
无歪斜
您可以通过以下方式获得峰度值:
这些值表明:
桔梗:
恙虫病:
普通的:
那有帮助吗?