谁能向我解释偏度或峰度公式的来源?(我的意思是它的推导。)它背后的逻辑是什么?谁证明了?
偏度和峰度公式的证明/推导
你不应该期待证据,因为偏度和峰度是有些模糊的概念。
对称性在数学上是精确的,但相比之下,偏度却出奇的滑。峰度也许更是如此。
已经有相当多的尝试给出与这些概念相对应的措施,但这些经常有用的措施有时会令人惊讶地违反直觉。例如,当分布不对称时,基于矩的偏度可能为零(与阅读讨论偏度的基本文本时经常会发现的断言相矛盾)。
谁能向我解释偏度或峰度公式的来源?
偏度和峰度都是一些模糊的术语,有几种不同的度量。
如今,人们主要指的是基于矩的度量,分别基于标准化的第三和第四矩。
一些历史
应用于概率分布的术语“偏度”从最初的外观似乎起源于 Karl Pearson, 1895。他首先谈到不对称。
应用于概率分布的术语“峰度。
Pearson 在他 1895 年的论文中给出了矩峰度和矩偏度平方(和)的公式,它们在某种意义上被用来帮助描述形状,尽管峰度的概念并不是特别在那里开发。
然而,比第二个更高(标准化)的时刻可以被认为是某种形状的度量或至少是偏离常态的想法似乎比这更古老。
请特别注意尼克考克斯的文章中包含的历史信息,这表明我们应该优先考虑 Thiele (1889)。
但是,除了基于矩的量之外,还有其他度量。例如,在偏度的情况下,有Pearson 的第一和第二偏度系数,它们基于分别缩放均值和众数与均值和中值之间差异的简单概念。(我认为这些也可以追溯到 1895 年的论文,但我没有检查过。)
这些与同一基本概念相关的不同度量可以暗示完全不同的事物(甚至符号相反)。例如看这里。可以在这里看到对过度解释矩峰度保持谨慎的原因
编辑:附加信息——
似乎米勒等人在最早已知的一些数学词的使用中关于偏度和峰度的条目。同意我的观点,它们似乎分别起源于 1895 年和 1905 年的 Karl Pearson。
很高兴得到某种程度的确认。
我的意思是,为什么偏度被定义为第三个中心矩,而不是第五个或任何其他数字?其背后的逻辑是什么?
好的,所以我们专门处理矩偏度。
首先,为什么第三个时刻是有道理的。让我们首先以某种直观的方式考虑偏度,而不是依赖正式的定义,看看它可能意味着什么。
回想一下,代表一种“典型”的观测值与平均值的距离,并考虑当我们采用看起来对称的分布并使其更右偏时会发生什么(同时试图保持面积,和持续的):
在这里,我们将轴分为四个区域 - 大致位于低于平均值一个标准差、低于平均值一个标准差、低于平均值一个标准差和高于平均值一个标准差 - 部分分别为到
对于偏度的轻微增加,我们倾向于在均值左侧(区域)和远高于均值(区域)处看到相对更多的概率,而在均值上方(区域)和远处看到的概率相对较少下方(区域)。
事实上,通过试图保持面积不变,如果我们抬起远尾(的右端),我们被迫在其他地方有更少的概率。但是,如果我们想保持均值不变,我们必须在更低的某个地方有更多的概率。如果我们将补偿概率放入“ ”(降低和),我们可以保持面积和均值不变,但我们最终会得到对称变化(实际上,我们会增加方差,而不是使其更偏斜)。
我们不能提升,因为同时提升和会使平均值上移。
因此,如果我们抬起右尾(),同时保持面积、均值和标准差不变,我们也可以提升中的概率,并减少其他两个——如果我们在其中得到相对数量和位置地区。保持几乎恒定限制了我们所做的事情比我真正描述的要多(该图有点不准确,如图所示,增加了)。
因此,为了使它看起来更正确一点,我们倾向于按照大致在这些区域中描述的方式进行移动。
但是,如果我们尝试构建一个简单的基于矩的度量,这意味着什么?请注意,对于第三个中心矩,或中的更多区域将倾向于减少它,而或中的更多区域将倾向于增加它(其他条件相同),但正如我们所看到的,我们不能在不考虑的情况下增加区域它在别处。将高于 1 的东西拉出比将低于 1 的东西“拉入”更多,所以如果我们在从上,第三个时刻仍然会增加。类似地,如果我们在中取走的同时,第三时刻将再次趋于增加。也就是说,我们刚刚得出的粗略的“偏度增加”似乎与第三时刻非常吻合。
现在这个讨论根本不排除第五个和更高的时刻 - 实际上,第三个时刻的增加也会倾向于增加第五个(除非你确实非常小心地这样做),但是(标准化的)第三个时刻将是最简单的使用基于矩的度量来捕获偏度概念的方法;而第五个时刻更复杂,并且可以以无法像第三个时刻那样捕捉我们的偏斜感的方式移动。
第三个标准化时刻并不完全符合我们的偏斜感,但它是一个非常好的、简单的度量,大部分都符合它。
我发现的唯一解释是,由于均值是数据的中心,将其提高到奇次幂会取消该项,如果数据分布是对称的,最终答案将为零,如果不是对称的,则最终答案将为零。这是真的?
1)尽管在基本处理中很容易找到这样的评论**,但严格来说,就概率分布而言,这两个部分实际上都不是真的。
a) 分布可能是对称的,但三阶矩不为零。一个简单的反例是具有 3 个或更少自由度的任何 t 分布。然而,在样本中,对称性意味着零三次矩——但样本几乎从来都不是完全对称的,所以在那里也没有多大用处。
b) 非对称分布的三阶矩可能为零。
所以对称并不一定意味着零三阶矩,零三阶矩不一定意味着对称。
2)在任何情况下,这都不能解释“为什么是第三次而不是第五次”,因为五次方和三次方一样奇怪。
**(事实上,因为我经常被问到是否会推荐一本特定的书,所以第二部分(即声称意味着对称)是我在评估一本基础书是否适合时使用的几个“快速测试”之一值得更仔细地研究——如果一个文本偶然发现了两个或更多我倾向于看到的常见基本错误,我不会浪费更多时间去寻找。)
参考
[1]: Pearson, K. (1895),
“Contributions to the Mathematical Theory of Evolution, II: Skew Variation in Homogeneous Material,”
Philosophical Transactions of the Royal Society , Series A, 186, 343-414
[版权所有。在这里免费提供]
[2]: Pearson, K. (1905),
"Das Fehlergesetz und Seine Verallgemeinerungen Durch Fechner und Pearson.", a rejoinder (Skew variation, a rejoinder),
Biometrika , 4 (1905), pp. 169–212。
[虽然这也完全不受版权保护(例如,我可以找到 3 年后的 Biometrika 的副本),但我找不到可以链接到的副本。Oxford Journals 想要在一天内收取 38 美元的费用,以获取长期不受版权保护的内容。如果您没有机构访问提供访问权限的地方之一,那么您可能在这个地方不走运。]
[3]: Cox, NJ (2010),
“Speaking Stata: The limits of sample skewness and kurtosis”,
The Stata Journal , 10 , Number 3, pp. 482–495(可在此处在线获取)
[4]: Thiele, TN (1889),
Forlæsinger over Almindelig Iagttagelseslære: Sandsynlighedsregning og Mindste Kvadraters Methode,
哥本哈根:CA Reitzel。[出于版权。有英文翻译 - 请参阅 [3] 中的 Thiele 参考资料。]
[5]:米勒,杰夫;等人,(2014 年 8 月 16 日访问),
一些数学词汇的最早已知用途,
请参见此处