标准差在非正态分布中告诉我们什么

机器算法验证 正态分布 标准差 偏度
2022-02-09 05:34:28

在正态分布中,68-95-99.7 规则赋予标准差很多意义,但标准差在非正态分布(多峰分布或偏态分布)中意味着什么?所有数据值是否仍会落在 3 个标准差范围内?对于非正态分布,我们是否有类似 68-95-99.7 的规则?

3个回答

它是第二个中心矩的平方根,即方差。矩与特征函数(CF) 相关,特征函数之所以称为特征,是因为它们定义了概率分布。所以,如果你知道所有时刻,你就知道 CF,因此你知道整个概率分布。

正态分布的特征函数仅由两个矩定义:均值和方差(或标准差)。因此,对于正态分布,标准差尤为重要,它在某种程度上是其定义的 50%。

对于其他分布,标准偏差在某些方面不太重要,因为它们还有其他时刻。然而,对于实践中使用的许多分布,前几个矩是最大的,所以它们是最重要的。

现在,直观地说,平均值告诉你分布的中心在哪里,而标准差告诉你数据离这个中心有多近。

由于标准差是以变量为单位的,因此它还用于缩放其他时刻以获得诸如峰度之类的度量。峰度是一个无量纲度量,它告诉你分布的尾部与正常相比有多胖

标准偏差是变化的一种特定度量。还有其他几个,平均绝对偏差相当受欢迎。标准偏差绝不是特殊的。使它显得特别的是高斯分布是特别的。

正如评论中指出的那样,切比雪夫的不等式对于获得感觉很有用。不过还有更多

样本标准差是对观测值与平均值的偏差的度量,其单位与用于测量数据的单位相同。正态分布,或者不是。

具体来说,它是均方偏离均值的平方根。

因此,标准偏差告诉您数据与平均值的分布程度,无论分布如何。