机器算法验证 - “标准化”标准开发？ - 吾爱随笔录

“标准化”标准开发？

机器算法验证标准差

2022-03-25 11:59:16

首先，我不是统计人员，但偶然发现了这个网站，我想我会问一个可能很愚蠢的问题：

我正在查看一些损益表数据，其中行项目是销售、直接成本、广告成本等。我有 12 个月的数据，并试图将每个行项目绘制在 x 轴的散点图上是跨 12 个月的变化，y 轴是全年的大小（例如 12 个月的总和）。

我正在使用标准。dev 用于可变性，我最终得到的几乎是一条线（从左下角到右上角），因为 std dev 是一个数量级（如果我说得对的话）。有没有办法“标准化”标准。开发。或计算不依赖于大小/大小的可变性？

谢谢！

2个回答

对于销售和成本等非负经济量，价差可能往往与均值成正比，查看变异系数通常是明智的，即标准差/均值。

CV 是无量纲的（无论您以美元还是数百万美元衡量都没有关系，CV 没有任何变化）。上面的链接给出了一些优点和缺点。

项的总和往往具有较低的变异系数（因此年度汇总的变异系数往往低于每月总计的变异系数）。

您想使用标准分数，也称为 z-score。

方程是：

z = \frac{x - μ}{σ}

$z = \frac{x - \mu}\sigma$

在哪里 $x$ 是您正在测试的值，\mu 是值的平均值，并且 $\sigma$ 是标准差。

因此，例如，以下几组不同比例的数字都将返回相同的 $z$ -得分时 $x$ 与相对于尺度的平均值的距离相同：

[10, 20, 30, 40, 50]
x = 40
z = (40 - 30) / 15.8113883
z = 0.632455532

[1000, 2000, 3000, 4000, 5000]
x = 4000
z = (4000 - 3000) / 1581.13883
z = 0.632455532

其它你可能感兴趣的问题

上一篇多任务和多类学习有什么区别下一篇密度和概率之间的差异