方差和标准差有什么区别?

机器算法验证 方差 数理统计 标准差
2022-02-06 12:13:38

我想知道方差和标准偏差之间的区别是什么。

如果你计算这两个值,很明显你从方差中得到了标准偏差,但是就你观察到的分布而言,这意味着什么?

此外,为什么你真的需要标准差?

4个回答

标准差是方差的平方根。

标准差以与平均值相同的单位表示,而方差以平方单位表示,但为了查看分布,只要您清楚自己使用的是什么,您就可以使用其中任何一种。例如,平均值 = 10 和 sd = 3 的正态分布与平均值 = 10 和方差 = 9 的正态分布完全相同。

你不需要两者。他们每个人都有不同的目的。SD 通常更有助于描述数据的可变性,而方差通常在数学上更有用。例如,不相关分布的总和(随机变量)也有一个方差,即这些分布的方差之和。SD不会是这样。另一方面,SD 具有以原始变量为单位表示的便利性。

如果约翰在说“不相关的分布”时指的是独立随机变量,那么他的回答是正确的。但是,要回答您的问题,可以添加几点:

  1. 均值和方差是确定正态分布的两个参数。

  2. Chebyshev 不等式限制了观察到的随机变量在范围内的概率k均值的标准差。

  3. 标准差用于标准化统计检验的统计数据(例如,已知标准差用于标准化样本均值z测试平均值与0或者当真实标准差未知时,使用样本标准差对样本均值进行归一化,导致t测试)。

  4. 对于正态分布68%分布的百分比在1标准差。95.4%之内2标准差及以上99%之内3标准偏差。

  5. 误差幅度表示为估计值标准差的倍数。

  6. 方差和偏差是随机量中不确定性的度量。估计的均方误差等于方差 + 平方偏差。

数据集的方差衡量数据相对于平均值的数学离散度。然而,尽管这个值在理论上是正确的,但很难在现实世界中应用,因为用于计算它的值是平方的。标准差,作为方差的平方根,给出的值与原始值的单位相同,这使得它更容易使用,也更容易与正态曲线的概念一起解释。