首先,我不是统计人员,但偶然发现了这个网站,我想我会问一个可能很愚蠢的问题:
我正在查看一些损益表数据,其中行项目是销售、直接成本、广告成本等。我有 12 个月的数据,并试图将每个行项目绘制在 x 轴的散点图上是跨 12 个月的变化,y 轴是全年的大小(例如 12 个月的总和)。
我正在使用标准。dev 用于可变性,我最终得到的几乎是一条线(从左下角到右上角),因为 std dev 是一个数量级(如果我说得对的话)。有没有办法“标准化”标准。开发。或计算不依赖于大小/大小的可变性?
谢谢!
首先,我不是统计人员,但偶然发现了这个网站,我想我会问一个可能很愚蠢的问题:
我正在查看一些损益表数据,其中行项目是销售、直接成本、广告成本等。我有 12 个月的数据,并试图将每个行项目绘制在 x 轴的散点图上是跨 12 个月的变化,y 轴是全年的大小(例如 12 个月的总和)。
我正在使用标准。dev 用于可变性,我最终得到的几乎是一条线(从左下角到右上角),因为 std dev 是一个数量级(如果我说得对的话)。有没有办法“标准化”标准。开发。或计算不依赖于大小/大小的可变性?
谢谢!
对于销售和成本等非负经济量,价差可能往往与均值成正比,查看变异系数通常是明智的,即标准差/均值。
CV 是无量纲的(无论您以美元还是数百万美元衡量都没有关系,CV 没有任何变化)。上面的链接给出了一些优点和缺点。
项的总和往往具有较低的变异系数(因此年度汇总的变异系数往往低于每月总计的变异系数)。
您想使用标准分数,也称为 z-score。
方程是:
在哪里是您正在测试的值,\mu 是值的平均值,并且是标准差。
因此,例如,以下几组不同比例的数字都将返回相同的-得分时与相对于尺度的平均值的距离相同:
[10, 20, 30, 40, 50]
x = 40
z = (40 - 30) / 15.8113883
z = 0.632455532
[1000, 2000, 3000, 4000, 5000]
x = 4000
z = (4000 - 3000) / 1581.13883
z = 0.632455532