我们应该在应用统计课程中教授峰度吗?如果是这样,怎么做?

机器算法验证 描述性统计 峰度 教学 l 时刻
2022-01-25 06:14:13

至少在直观的基础上,集中趋势、散布和偏度都可以相对较好地定义;这些事物的标准数学度量也与我们的直觉概念相对较好地对应。但峰度似乎有所不同。它非常令人困惑,并且与任何关于分布形状的直觉都不匹配。

应用设置中峰态的典型解释是使用 Microsoft Excel 进行商业和管理应用统计的摘录 [1]

峰度是指分布的峰值程度或相反的平坦程度。如果尾部中的数据值多于您对正态分布的预期,则峰度为正。相反,如果尾部中的数据值少于您在正态分布中的预期,则峰度为负。除非您至少有四个数据值,否则 Excel 无法计算此统计数据。

除了混淆“峰度”和“过度峰度”(在本书中,通常使用前者来指代其他作者所称的后者)之外,“峰度”或“平坦度”的解释然后被注意力转移到尾部有多少数据项而混乱。考虑“峰”和“尾”是必要的——卡普兰斯基[2]1945 年抱怨说,当时的许多教科书错误地指出峰度与分布的峰值与正态分布的峰值相比有多高有关,而没有考虑尾部。但显然,必须同时考虑峰顶和尾部的形状,这使得直觉更难掌握,上面引用的摘录跳过了这一点,将尾部从峰顶转向沉重,就好像这些概念是相同的一样。

此外,这种对峰度的经典“峰尾”解释仅适用于对称和单峰分布(实际上,该文本中的示例都是对称的)。然而,解释峰度的“正确”一般方式,无论是用“峰”、“尾”还是“肩”,都存在数十年的争议[2][3][4][5][6]

是否有一种在应用环境中教授峰度的直观方法,当采用更严格的方法时不会遇到矛盾或反例?在这类应用数据分析课程的背景下,峰度甚至是一个有用的概念,而不是在数理统计课程中?如果分布的“峰值”是一个直观有用的概念,我们是否应该通过L 矩来教授它[7]反而?

[1]Herkenhoff, L. 和 Fogli, J. (2013)。使用 Microsoft Excel 进行业务和管理的应用统计纽约,纽约:斯普林格。

[2]卡普兰斯基,一世(1945 年)。“关于峰度的常见错误”。 美国统计协会杂志40 (230): 259。

[3]理查德 B 达灵顿 (1970)。“峰度真的是‘峰值’吗?”。美国统计学家 24 (2): 19–22

[4]摩尔人,JJA。(1986) “峰度的含义:重新审视达灵顿”。美国统计学家 40 (4): 283–284

[5]Balanda, Kevin P. 和 MacGillivray, HL (1988)。峰度:批判性评论”。美国统计学家 42 (2): 111–119

[6]德卡洛,LT (1997)。关于峰度的含义和使用”。心理学方法, 2 (3), 292. 芝加哥

[7]霍斯金,JRM (1992)。“矩还是 L 矩?一个比较分布形状的两种度量的例子”。美国统计学家46 (3): 186–189

4个回答

峰度真的很简单......而且很有用。它只是对异常值或尾部的度量。它与峰值无关 - 必须放弃该定义。

这是一个数据集:
0、3、4、1、2、3、0、2、1、3、2、0、2、2、3、2、5、2、3、999

请注意,“999”是一个异常值。

这里有z4数据集中的值:

0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00,0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 0.00, 360.98

请注意,只有异常值给出了z4与 0 明显不同。

这些的平均值z4values 是经验分布的峰度(如果您愿意,可以减去 3,这与我提出的观点无关):18.05

从这个计算中应该很明显,“峰值”附近的数据(非异常数据)对峰度统计几乎没有贡献。

峰度可用作异常值的度量。异常值对小学生很重要,因此应该教授峰态。但峰度实际上与峰值无关,无论是尖峰、平坦峰、双峰峰还是无限峰。您可以拥有上述所有具有小峰度和所有上述具有大峰度。所以它永远不应该被呈现为与峰值有任何关系,因为那会传授不正确的信息。它还使材料不必要地令人困惑,并且看起来不太有用。

概括:

  1. 峰度可用于衡量尾部(异常值)。
  2. 峰度与峰值无关。
  3. 峰度实际上很有用,应该教,但只能作为异常值的度量。教峰度时不要提及峰值。

这篇文章清楚地解释了为什么“峰值”定义现在正式死了。

Westfall,PH(2014)。峰度峰度,1905 – 2014 年。RIP美国统计学家68 (3), 191–195。

虽然这个问题有些模糊,但很有趣。在什么水平上教授峰度?我记得在线性模型的(硕士水平)课程中提到过它(很久以前,基于 Seber 的书的第一版)。这不是一个重要的话题,但它进入了诸如研究方差相等的似然比检验 (F-test) 的(缺乏)稳健性之类的话题,其中(从记忆中)正确的水平渐近地取决于具有与正态分布,这太过分了!我们看到 Oja 的一篇论文(但我从未阅读过它的详细信息)http://www.jstor.org/stable/4615828?seq=1#page_scan_tab_contents ,它试图找出什么是偏度、峰度等真正的衡量标准。

为什么我觉得这很有趣?因为我一直在拉丁美洲教书,在那里似乎许多人都在教授偏度和峰度作为重要主题,并试图告诉研究生(许多来自经济领域)峰度是分布形式的不良度量(主要是因为四次方的采样变异性太大),很难。我试图让他们改用 QQplots。所以,对于一些评论者来说,是的,这是在某些地方教授的,可能很多!

顺便说一句,这不仅仅是我的意见。以下博客文章https://www.spcforexcel.com/knowledge/basic-statistics/are-skewness-and-kurtosis-useful-statistics 包含此引文(归属于惠勒博士):

简而言之,偏度和峰度实际上毫无价值。休哈特在他的第一本书中提出了这一观察。偏度和峰度的统计数据根本没有提供任何有用的信息,而这些信息已经由位置和分散的度量提供。

我们应该教更好的技术来研究分布的形式!例如 QQplots(或相对分布图)。而且,如果有人仍然需要数值测量,那么基于 L 矩的测量会更好。我将引用 JRM Hosking 的论文 JR Statist Soc B (1990) 52, No 1, pp 105--124 中的一段话:“L-moments: Analysis and Estimation of Distribution of Distribution using Linear Combination of Order Statistics”,第 109 页:

对这些 L 矩解释的另一种解释可能基于 Oja (1981) 的工作,Oja 定义了直观合理的标准,即实线上的一个概率分布位于更靠右的位置(更分散、更偏斜、更峰度)比另一个。一个分布的实值泛函保留了这些标准所暗示的分布的部分排序,然后可以合理地称为“位置度量(离散度、偏度、峰度)”。从 Oja 的工作中可以立即得出以下结论:λ1λ2,在 Oja 的符号中,μ(F)12σ1(F), 分别是位置和规模的度量。Hosking (1989) 表明τ3τ4根据 Oja 的标准,分别是偏度和峰度的度量。

(目前,关于这些度量的定义,我参考了论文,它们都是基于 L 矩的。)有趣的是,基于四阶矩的传统峰度度量不是峰度度量在奥哈的意义上!(当我能找到它时,我将编辑该声明的引用)。

我认为,偏度系数有助于激发这些术语:正偏斜和负偏斜。但是,如果您的目标是评估正常性,那就是它停止的地方。偏度和峰度的经典测量通常无法捕捉到偏离常态的各种类型的偏差。我通常提倡我的学生使用图形技术来评估评估正态性是否合理,例如 qq-plot 或正态概率图。同样对于足够大小的样本,也可以使用直方图。箱线图对于识别异常值甚至重尾也很有用。

这符合 1999 年 APA 工作组的建议:

假设。 您应该努力确保分析所需的基本假设在给定数据的情况下是合理的。仔细检查残留物。不要使用分布检验和形状统计指数(例如,偏度、峰度)来代替以图形方式检查残差。使用统计测试来诊断模型拟合中的问题有几个缺点。首先,基于汇总统计的诊断显着性检验(例如方差同质性检验)通常不切实际敏感;我们对模型的统计测试通常比我们对假设的统计测试更稳健。其次,偏度和峰度等统计数据通常无法检测到残差中的分布不规则性。第三,统计检验取决于样本量,随着样本量的增加,测试通常会拒绝无害的假设。一般来说,没有什么可以替代假设的图形分析。"

参考:Wilkinson, L. 和统计推断工作组。(1999)。心理学期刊中的统计方法:指南和解释。美国心理学家,54,594-604。

根据课程的应用情况,可能会出现估计准确性的问题。方差估计的准确性很大程度上取决于峰度。发生这种情况的原因是,在峰度较高的情况下,该分布允许稀有、极端的潜在可观察数据。因此,数据生成过程将在某些样本中产生非常极端的值,而在其他样本中则不那么极端。在前一种情况下,你会得到一个非常大的方差估计,而在后一种情况下,你会得到一个很小的方差估计。

如果消除过时和不正确的“峰值”解释,而将重点完全放在异常值(即罕见的、极端的可观察值)上,那么在入门课程中教授峰态会更容易。但是人们绞尽脑汁试图证明“峰度”是正确的,因为在他们的教科书中(错误地)这样说,他们错过了峰度的真正应用。这些应用程序大多与异常值有关,当然异常值在应用统计学课程中很重要。