方差是比标准差更基本的概念吗?

机器算法验证 方差 标准差
2022-01-18 16:46:34

这个心理测量学网站上,我读到了

[A] 深度方差是比标准差更基本的概念。

该网站并没有真正进一步解释为什么方差比标准偏差更基本,但它提醒我我在这个网站上读过一些类似的东西。

例如,@kjetil-b-halvorsen 在此评论中写道:“标准偏差有利于解释和报告。对于发展理论,方差更好”。

我觉得这些说法是相互关联的,但我并不真正理解它们。我知道样本方差的平方根不是总体标准差的无偏估计,但肯定不止于此。

也许“基本”这个词对于这个网站来说太模糊了。在那种情况下,也许我们可以将我的问题操作化为从发展统计理论的角度来看,方差是否比标准偏差更重要。为什么/为什么不?

4个回答

Robert 和 Bey 的回答确实给出了部分原因(即矩往往被视为分布的基本属性,并且传统上标准差是根据第二个中心矩而不是相反的方式定义的),但是那些事情真的很重要,部分取决于我们所说的这个词的含义。

没有不可克服的问题,例如,如果我们的约定反过来——没有什么能阻止我们按照惯例定义一些其他的量序列来代替通常的时刻,比如说E[(Xμ)p]1/p为了p=1,2,3,...(注意μ适合矩序列和这个作为第一项),然后根据它们定义矩 - 以及与矩相关的所有计算方式。请注意,这些量都是以原始单位测量的,这是优于矩的一个优势(在p- 原始单位的幂,因此更难解释)。这将使总体标准偏差成为定义的数量和根据它定义的方差。

但是,它会使像矩生成函数(或与上面定义的新量相关的一些等价物)这样的量变得不那么“自然”,这会使事情变得更加尴尬(但有些约定有点像)。MGF 有一些方便的属性,用另一种方式转换就不会那么方便了。

在我看来(但与之相关)更基本的是,有许多基本的方差性质,当写成方差性质时比写成标准偏差性质时更方便(例如,独立的总和的方差随机变量是方差的总和)。

这种可加性是其他分散度量不具有的属性,它具有许多重要的后果。

[其他累积量之间也有类似的关系,因此某种意义上,我们可能想要更一般地定义与矩相关的事物。]

所有这些原因都可以说是惯例或方便,但在某种程度上,这是一个观点问题(例如,从某些观点来看,时刻是非常重要的数量,而从其他观点来看,它们并不是那么重要)。可能“在深层次上”这一位的目的只是暗示 kjetil 的“在发展理论时”。

我同意您在问题中提出的 kjetil 的观点;在某种程度上,这个答案只是对它的随意讨论。

方差由分布的一阶矩和二阶定义。相比之下,标准差更像是一个“规范”,而不是一个时刻。矩是分布的基本属性,而范数只是区分的方法。

方差比标准差更基本,因为标准差被定义为“方差的平方根”,例如它的定义完全取决于方差。

另一方面,方差完全独立地定义为“样本与平均值之间的平方差的期望值”。

除了这里给出的答案之外,如果我们考虑来自(例如正常)总体的估计,人们可能会指出,在某种意义上,方差比标准差更“基本”。对于大小样本n从人群中提取XVar[X]=σ2, 已知样本方差S2是一个无偏估计量σ2, 但S通常不是一个无偏估计量σ

E[S2]=σ2, E[S]σ,
这里,这是从 Jensen 不等式得出的。