样本的方差可以定义为
除了的因素,这可以口头解释为
方差是不同数据点对之间的平方距离的平均值
在数学上,这相当于方差的“通常”定义,。然而,从概念上讲,它(在我看来)在两个方面完全不同:
- 这个定义没有参考平均值 ; 我们不是在测量点与平均值之间的距离,而是在测量点之间的距离。
- 的因子——众所周知,它是学生混淆的根源(参见,例如,计算标准差时除以的直观解释? )——自然出现,因为有有序的不同数据点对。不需要关于“缓冲”样本方差的挥手理由,也不需要复杂的估计偏差计算。
同样,为了清楚起见,我理解为什么的分母,并且我理解上面的双和定义在数学上等同于标准定义。我想知道的:
是否有上下文(教学或其他)更常提及方差的替代定义(作为数据点对的双和)?例如,是否有任何教科书将其作为主要定义?