Robert 和 Bey 的回答确实给出了部分原因(即矩往往被视为分布的基本属性,并且传统上标准差是根据第二个中心矩而不是相反的方式定义的),但是那些事情真的很重要,部分取决于我们所说的这个词的含义。
没有不可克服的问题,例如,如果我们的约定反过来——没有什么能阻止我们按照惯例定义一些其他的量序列来代替通常的时刻,比如说E[(X−μ)p]1/p为了p=1,2,3,...(注意μ适合矩序列和这个作为第一项),然后根据它们定义矩 - 以及与矩相关的所有计算方式。请注意,这些量都是以原始单位测量的,这是优于矩的一个优势(在p- 原始单位的幂,因此更难解释)。这将使总体标准偏差成为定义的数量和根据它定义的方差。
但是,它会使像矩生成函数(或与上面定义的新量相关的一些等价物)这样的量变得不那么“自然”,这会使事情变得更加尴尬(但有些约定有点像)。MGF 有一些方便的属性,用另一种方式转换就不会那么方便了。
在我看来(但与之相关)更基本的是,有许多基本的方差性质,当写成方差性质时比写成标准偏差性质时更方便(例如,独立的总和的方差随机变量是方差的总和)。
这种可加性是其他分散度量不具有的属性,它具有许多重要的后果。
[其他累积量之间也有类似的关系,因此在某种意义上,我们可能想要更一般地定义与矩相关的事物。]
所有这些原因都可以说是惯例或方便,但在某种程度上,这是一个观点问题(例如,从某些观点来看,时刻是非常重要的数量,而从其他观点来看,它们并不是那么重要)。可能“在深层次上”这一位的目的只是暗示 kjetil 的“在发展理论时”。
我同意您在问题中提出的 kjetil 的观点;在某种程度上,这个答案只是对它的随意讨论。