是否有标准化的偏度和峰度等价物?

机器算法验证 偏度 峰度
2022-03-27 00:49:05

与数据具有相同单位的偏度的标准化等价物是什么?同样,峰度的归一化等价物是多少?理想情况下,这些函数对于数据应该是线性的,这意味着如果所有观测值都乘以一个因子n,则得到的归一化偏度和峰度将乘以相同的因子n拥有这种标准化等价物的好处是能够将它们覆盖在标准的盒须图之上。

3个回答

偏度测量是故意没有单位的。

通常的矩偏度是标准化的第三矩,E[(Xμσ)3].

如果你居中但不标准化,你有μ3=E[(Xμ)3]...这显然是立方单位

如果您想要与单位相同的东西X,你必须取立方根,就像我们取方差的平方根并得到与原始数据相同的单位一样。(但是 - 请注意,因为许多包不会采用负数的立方根,您可能必须将其计算为:sign(Xμ)×|E(Xμ)3|1/3.)

我不确定这会有多大用处。

对于其他一些偏度度量,例如两个 Pearson 偏度度量,您只需乘以σ.

对于样本偏度度量,其中σμ通常不知道,与样本偏度一样,您通常会用他们自己的样本估计值替换它们。

峰度遵循相同的模式 - 对于矩峰度,您需要对非标准化的四阶矩求四根,才能得到与数据成比例的东西。

对于其他一些峰度度量,它们只需要乘以σ.

偏度和峰度是形状特征。所以,如果我告诉你这个东西,一个球,是的,那么这个东西的半径是多少并不重要。它可以是一个小球或一个大另一方面,当我说球或立方体时,我指的是物体的大小,而不是形状。

在这方面,标准差是分布的大小,这就是为什么偏度和峰度按大小归一化的原因。您也可以说标准差属于力学,偏度和峰度属于几何。因此,不,我们不需要以变量的度量单位来表示它们。大小和形状是分开的。一个大球和一个小球是同样的,即在这种情况下大小无关紧要:)

表示分布在区域中的向量R,让我们假设第零和第一时刻已经归一化。第二个时刻计算为M2=RxxT|dx|, 所以如果我们能找到对角化M2=PΛ2PT,那么我们就可以定义

x=Λ1PTx
以便M2归一化:

M2ij=R(Λ1PTx)(Λ1PTx)T|dx|
=Λ1PT(RxxT|dx|)PΛ1
=Λ1PTPΛ2PTPΛ1=I

二阶矩的几何意义是“方向”,这可以通过对角化使二阶矩归一化这一事实来证明。在这种归一化下计算偏度时,称为Mardia 偏度