我试图围绕方差定义来思考。
给定一组值S和n = #(S),方差定义为:
其平方根(标准差)衡量的是这些值与平均值的平均距离。
但是,有一个更简单的公式也可以测量值与平均值的距离:
我试图理解我们使用平方根而不是更简单的模块函数这一事实背后的原因。是否有真正的原因为什么以第一种方式而不是第二种方式定义方差?
# 编辑 #
好的,看起来到目前为止给定的原因比我预期的要先进得多。
平方它而不是取模数的论点说模数使数学更复杂是有效的,但更多的是定义的结果,而不是它被定义为恕我直言的原因。中心极限定理也是如此。
我最终在可汗学院找到了完全相同的问题。在那里,还给出了以下原因:
- “平方强调更大的差异(想想异常值的影响)。” 另一条评论还指出:“除了放大均值的较大差异外,平方还可以最小化均值的微小差异”。
这些是迄今为止我发现的最有说服力的理由。模数不会强调大值,也不会最小化小值。然而,同样的论点适用于任何偶数幂。4 的幂也会放大较大的差异并最小化微小的差异(实际上它会在这些方面做得更好)。那么为什么不采用 4 的幂呢?(或任何其他偶数)。
- “(...)您还可以将方程视为所有点之间的欧几里得距离和点的平均值”
对我来说,这更像是“拥有”而不是理由。如果有的话,这些模块会给出曼哈顿距离。所以呢?
说了这么多,我还不是100%相信。我相信这个问题比乍一看要深得多,而且从可汗学院的投票数来看,我并不是唯一一个对此感到困惑的人。