我一直将标准差理解为观察值与平均值的平均距离。但是,当我在 Excel 中生成 n = 1,000,000 的标准正态分布 N(0,1) 并取所有负面观察的平均值和所有正面观察的平均值时,我分别得到了大约 -0.80 和 +0.80预计会得到-1和+1。经验结果表明,一个观测值与 EV = 0 的平均距离为 0.8,而标准差为 1。
我如何在概念上根据自己的理解来协调这一点?
我一直将标准差理解为观察值与平均值的平均距离。但是,当我在 Excel 中生成 n = 1,000,000 的标准正态分布 N(0,1) 并取所有负面观察的平均值和所有正面观察的平均值时,我分别得到了大约 -0.80 和 +0.80预计会得到-1和+1。经验结果表明,一个观测值与 EV = 0 的平均距离为 0.8,而标准差为 1。
我如何在概念上根据自己的理解来协调这一点?
如您所知,标准差是方差的平方根。方差是通过将与均值的平方偏差相加并将其除以来计算的。
每个差值都是平方的。当您取方差的平方根时,它与取每个的平方根并随后求和是不一样的...
由于平方项,方差(以及标准差)赋予更远的值更多的权重并且不能为负,因为正值和负值在平方时都为正值。
分别计算所有正值和负值的标准差也是错误的。这些值在平方时失去符号。
希望这可以帮助,
Basil 涵盖了基本问题(与平均值的平均距离与标准差不同),但我认为应该添加一些额外的点。
绝对偏差的平均值(与平均值) - 即与平均值的平均距离 - 将始终是,而不是与平均值的均方根偏差,即标准偏差 这来自三角形不等式,例如,或者来自 Jensen 的不等式。
对于从正态分布中提取的数据,在大样本中,平均偏差是乘以标准偏差......大约是 0.798,所以这是你的 80%。