我正在尝试了解Coefficient of Variation。当我尝试将其应用于以下两个数据样本时,我无法理解如何解释结果。
假设样本 1 是 ,样本 2 是。如您所见,此处示例 2示例 1
两者具有相同的标准偏差但和。
现在变异系数将不同。对于样本 2,它将小于样本 1。但是我如何解释该结果?就方差而言,两者是相同的;只是他们的手段不同。那么这里的变异系数有什么用呢?这只是误导我,或者我无法解释结果。
我正在尝试了解Coefficient of Variation。当我尝试将其应用于以下两个数据样本时,我无法理解如何解释结果。
假设样本 1 是 ,样本 2 是。如您所见,此处示例 2示例 1
两者具有相同的标准偏差但和。
现在变异系数将不同。对于样本 2,它将小于样本 1。但是我如何解释该结果?就方差而言,两者是相同的;只是他们的手段不同。那么这里的变异系数有什么用呢?这只是误导我,或者我无法解释结果。
在像您这样的示例中,当数据只是相加不同时,即我们向所有内容添加一些常数,然后当您指出标准偏差不变时,均值恰好被该常数改变,因此变异系数从到,既无趣也无用。
有趣的是乘法变化,其中变异系数有一些用处。因为将所有内容乘以某个常数意味着变异系数变为,即保持与以前相同。正如@Aksalal 和@Macond 的答案一样,更改测量单位就是一个很好的例子。
由于变异系数是无单位的,所以它也是无量纲的,因为基础变量拥有的任何单位或量纲都会被除法洗掉。这使得变异系数成为相对变异性的度量,因此可以将长度的相对变异性与权重的相对变异性进行比较,等等。变异系数已发现一些描述性用途的一个领域是生物学中生物体大小的形态计量学。
在原则和实践中,变异系数仅被完全定义并且对完全为正的变量完全有用。因此,详细地说,您的第一个值为的样本不是一个合适的例子。另一种看待这一点的方法是注意,如果平均值为零,则系数将是不确定的,如果平均值为负,则系数将为负,假设在后一种情况下标准差为正。任何一种情况都会使该度量无法作为相对可变性的度量,或者实际上对于任何其他目的都是无用的。
一个等效的陈述是,只有当对数以通常的方式为所有值定义时,变异系数才是有趣和有用的,并且实际上使用变异系数等同于查看对数的变异性。
尽管对这里的读者来说这似乎令人难以置信,但我已经看到气候学和地理出版物,其中摄氏温度的变化系数使天真的科学家感到困惑,他们指出,当平均温度接近 C 并变为负值时,系数可能会爆炸平均温度低于冰点。更奇怪的是,我看到有人建议使用华氏温度来解决问题。相反,当且仅当测量尺度符合比率尺度时,变异系数通常被正确地称为定义的汇总度量。碰巧的是,即使对于以开尔文测量的温度,变异系数也不是特别有用,而是出于物理原因而不是数学或统计原因。
就像气候学中奇怪的例子一样,由于作者既不值得称赞也不值得羞耻,我没有提及这些例子,变异系数在某些领域被过度使用。有时倾向于将其视为一种包含均值和标准差的神奇汇总度量。这自然是原始思维,因为即使该比率有意义,也无法从中恢复平均值和标准差。
在统计学中,如果变异遵循伽马或对数正态,变异系数是一个相当自然的参数,这可以通过查看这些分布的变异系数的形式来看出。
尽管变异系数可能有一些用处,但在应用它的情况下,更有用的步骤是在对数尺度上工作,通过对数变换或在广义线性模型中使用对数链接函数。
编辑:如果所有值都是负数,那么我们可以将符号视为可以忽略的约定。等效地,在这种情况下,实际上是变异系数的同卵双胞胎。
编辑 2020 年 5 月 25 日:在 Simpson, GG, Roe, A. 和 Lewontin, RC 1960 中进行了详细的讨论。定量动物学。纽约:Harcourt, Brace,第 89-94 页。该文本不可避免地在某些方面过时,但包含许多清晰的解释和好斗的评论和批评。
另见 Lewontin, RC 1966。关于相对变异性的测量。 系统生物学15:141-142。https://doi.org/10.2307/sysbio/15.2.141
想象一下,我说“这个镇上有 1,625,330 人。正负五。” 我准确的人口统计知识会给您留下深刻的印象。
但如果我说“这房子里有五个人。正负五。” 你会认为我不知道房子里有多少人。
相同的标准差,不同的简历。
通常,您对不同度量单位或非常不同尺度的变量使用变异系数。您可以将其视为噪声/信号比。例如,您可能想比较学生体重和身高的变化;美国和摩纳哥国内生产总值的变化。
在您的情况下,变异系数可能根本没有多大意义,因为值差别不大。
) 所暗示的,具有较高值的样本相对于其平均值的变化较小。这实际上非常简单。在比较不同尺度的样本(或总体)之间的变异时,变异系数很有用。考虑一下您正在处理国家之间的工资问题。如果您使用方差而不是变异系数作为统计数据,比较美国和日本的工资变化提供的信息较少,因为 1 美元 ~= 100 日元和 1 个单位的工资差异在两个样本中并不意味着同样的事情。好吧,在这个例子中,您可以将所有内容转换为美元,然后进行计算,但如何在不同比例之间转换并不总是很明显。例如,在比较不同物种的体重变化时。