正态分布的峰度为 3 的说法是什么意思。是否意味着在水平线上, 3 的值对应于峰值概率,即 3 是系统的模式?
当我查看正态曲线时,似乎峰值出现在中心,也就是 0。那么为什么峰度不是 0 而是 3?
正态分布的峰度为 3 的说法是什么意思。是否意味着在水平线上, 3 的值对应于峰值概率,即 3 是系统的模式?
当我查看正态曲线时,似乎峰值出现在中心,也就是 0。那么为什么峰度不是 0 而是 3?
峰度肯定不是峰值所在的位置。正如你所说,这已经被称为模式。
峰度是标准化的四阶矩:如果是我们正在查看的变量的标准化版本,那么总体峰度是该标准化变量的平均四次方;。样本峰度相应地与一组标准化样本值的平均四次方相关(在某些情况下,它按在大样本中变为 1 的因子进行缩放)。
正如您所注意到的,在正态随机变量的情况下,这个第四个标准化矩是 3。正如 Alecos 在评论中指出的那样,有些人将峰度定义为;这有时被称为超峰态(它也是第四个累积量)。当看到“峰度”这个词时,您需要记住这种可能性,即不同的人使用同一个词来指代两个不同(但密切相关)的量。
峰度通常被描述为峰度*(例如,峰的弯曲程度——这可能是选择“峰度”这个词的意图)或重尾度(通常人们有兴趣用它来测量),但在实际上,通常的第四个标准化时刻并不能完全衡量这些事情中的任何一个。
事实上,Kendall 和 Stuart 的第一卷给出了反例,表明较高的峰度不一定与较高的峰值(在标准化变量中)或较胖的尾巴相关(以类似的方式,第三矩并不能完全衡量很多人认为确实如此)。
然而,在许多情况下,两者都有一些相关的趋势,因为当峰度较高时,往往会出现更大的峰度和重尾度——我们应该简单地提防,认为情况必然如此。
峰度和偏度密切相关(峰度必须至少比偏度的平方大 1;当分布接近对称时,峰度的解释更容易一些。
Darlington (1970) 和 Moors (1986) 表明,峰度的四阶矩量度实际上是关于“肩膀”的可变性 -,而 Balanda 和 MacGillivray (1988) 建议用与以下相关的模糊术语来考虑它这种感觉(并考虑一些其他方法来衡量它)。如果分布紧密集中在附近,那么峰度(必然)很小,而如果分布远离 (这将倾向于同时堆积在中心和将概率移动到尾部以使其远离肩部),第四矩峰度将很大。
De Carlo (1997) 是阅读峰态的合理起点(在 Wikipedia 等更基本的资源之后)。
编辑:我偶尔会看到一些关于更高峰值(接近 0 的值)是否会影响峰度的问题。答案是肯定的,绝对可以。这种情况是因为它是标准化变量的四阶矩——要增加标准化变量的四阶矩,您必须在保持不变。这意味着进一步向尾部移动的概率必须伴随着一些进一步进入(内部);反之亦然——如果在将方差保持在 1 的同时将更多的权重放在中心,你也会在尾部放一些。
[注意,正如评论中所讨论的,这作为一般性陈述是不正确的;这里需要一个稍微不同的声明。]
这种保持不变的方差效应与Darlington 和 Moors 的论文中将峰度作为“肩部变化”的讨论直接相关。这个结果不是一些手摇概念,而是一个简单的数学等价——如果不歪曲峰度,就不能认为它是其他的。
现在可以在不提升峰值同样,可以增加外部的概率,而不必使远处的尾部更重(例如,通过一些典型的尾部索引)。也就是说,在使尾部更轻的同时提高峰度是很有可能的(例如,在均值两侧超过 2sds 的尾部更轻,比如说)。
[我在参考文献中包含 Kendall 和 Stuart 是因为他们对峰度的讨论也与这一点相关。]
那么我们能说什么呢?峰度通常与更高的峰和更重的尾部相关联,而不必发生枯萎。当然,通过使用尾部来提升峰度更容易(因为可能会超过 1 sd)然后调整中心以保持方差不变,但这并不意味着峰值没有影响;确实如此,而且人们可以通过专注于它来操纵峰度。峰度很大程度上但不仅与尾巴沉重有关——再一次,看看肩部结果的变化;如果有什么是峰态所关注的,在不可避免的数学意义上。
参考
Balanda, KP 和 MacGillivray, HL (1988),
“峰度:批判性评论”。
美国统计学家 42 , 111-119。
Darlington, Richard B. (1970),
“峰度真的是“峰值吗?”。
美国统计学家 24 , 19-22。
Moors, JJA (1986),
“峰度的含义:重新审视达灵顿”。
美国统计学家 40 , 283-284。
DeCarlo, LT (1997),
“关于峰态的含义和使用”。
心理学。方法, 2,292-307。
Kendall, MG 和 A. Stuart,
高级统计理论,
卷。1,第三版。
(最近的版本有 Stuart 和 Ord)
这是一个直接的可视化,以了解数字“3”对于正态分布的峰度指的是什么。
令服从正态分布,令。让。考虑的。这条曲线在零的右边,并延伸到无穷大,有 0.999 分位数 117.2,但大部分质量接近于零;例如,68% 小于 1.0。
这种分布的平均值是峰态。理解平均值的一种常见方法是作为 pdf 图的“平衡点”。如果是正常的,则这条曲线 在 3.0 处平衡。
这种表示还解释了为什么峰度测量分布尾部的重度。如果是非正态分布,则曲线在峰度大于 3.0 时“向右下降”,因此在这种情况下,的密度可以说是“比正态分布更重尾”。 " 类似地,当峰度小于 3.0 时,曲线的密度可以说是“比正态分布更轻尾”。
通常认为更高的峰度是指靠近中心的更多质量(即,在 pdf 中靠近 0 的质量更多)。虽然在许多情况下这是正确的,但在高峰度情况下,显然不是接近零的(可能增加的)质量导致图形“向右下降”。相反,它是尾部杠杆。
从这个角度来看,峰度的基本正确“尾重”解释可能更具体地描述为“尾杠杆”,以避免将“增加的尾重”与“增加的尾部质量”混淆。毕竟,较高的峰度可能对应于尾部的较少质量,但这种减少的质量占据更远的位置。
“给我一个站立的地方,我将移动地球。” -阿基米德