至少在直观的基础上,集中趋势、散布和偏度都可以相对较好地定义;这些事物的标准数学度量也与我们的直觉概念相对较好地对应。但峰度似乎有所不同。它非常令人困惑,并且与任何关于分布形状的直觉都不匹配。
应用设置中峰态的典型解释是使用 Microsoft Excel 进行商业和管理应用统计的摘录 :
峰度是指分布的峰值程度或相反的平坦程度。如果尾部中的数据值多于您对正态分布的预期,则峰度为正。相反,如果尾部中的数据值少于您在正态分布中的预期,则峰度为负。除非您至少有四个数据值,否则 Excel 无法计算此统计数据。
除了混淆“峰度”和“过度峰度”(在本书中,通常使用前者来指代其他作者所称的后者)之外,“峰度”或“平坦度”的解释然后被注意力转移到尾部有多少数据项而混乱。考虑“峰”和“尾”是必要的——卡普兰斯基1945 年抱怨说,当时的许多教科书错误地指出峰度与分布的峰值与正态分布的峰值相比有多高有关,而没有考虑尾部。但显然,必须同时考虑峰顶和尾部的形状,这使得直觉更难掌握,上面引用的摘录跳过了这一点,将尾部从峰顶转向沉重,就好像这些概念是相同的一样。
此外,这种对峰度的经典“峰尾”解释仅适用于对称和单峰分布(实际上,该文本中的示例都是对称的)。然而,解释峰度的“正确”一般方式,无论是用“峰”、“尾”还是“肩”,都存在数十年的争议。
是否有一种在应用环境中教授峰度的直观方法,当采用更严格的方法时不会遇到矛盾或反例?在这类应用数据分析课程的背景下,峰度甚至是一个有用的概念,而不是在数理统计课程中?如果分布的“峰值”是一个直观有用的概念,我们是否应该通过L 矩来教授它反而?
Herkenhoff, L. 和 Fogli, J. (2013)。使用 Microsoft Excel 进行业务和管理的应用统计。纽约,纽约:斯普林格。
卡普兰斯基,一世(1945 年)。“关于峰度的常见错误”。 美国统计协会杂志,40 (230): 259。
理查德 B 达灵顿 (1970)。“峰度真的是‘峰值’吗?”。美国统计学家 24 (2): 19–22
摩尔人,JJA。(1986) “峰度的含义:重新审视达灵顿”。美国统计学家 40 (4): 283–284
Balanda, Kevin P. 和 MacGillivray, HL (1988)。“峰度:批判性评论”。美国统计学家 42 (2): 111–119
德卡洛,LT (1997)。“关于峰度的含义和使用”。心理学方法, 2 (3), 292. 芝加哥
霍斯金,JRM (1992)。“矩还是 L 矩?一个比较分布形状的两种度量的例子”。美国统计学家46 (3): 186–189