机器算法验证 - 如何对不同尺度的两个变量求和？ - 吾爱随笔录

机器算法验证分布

2022-03-12 07:48:01

如果我有两个变量遵循两个不同的分布并且具有不同的标准偏差......我需要如何转换两个变量，以便当我将两个结果相加时不会被更不稳定的结果“驱动”。

例如... 变量 A 的波动性低于变量 B（范围从 0 到 3000）并且变量 B 来回波动。300 到 350。

如果简单地将两个变量加在一起，结果显然是由 A 驱动的。

1个回答

一个常见的做法是标准化这两个变量， $A,B$ ，通过减去样本均值并除以样本标准差，将它们放在相同的比例上。完成此操作后，两个变量将在同一尺度上，因为它们每个的样本均值为 0，样本标准差为 1。因此，它们可以在没有一个变量的情况下添加，而不会产生不适当的影响，这仅仅是因为规模。

也就是说，计算

\frac{A - \bar{A}}{S D (A)}, \frac{B - \bar{B}}{S D (B)}

$\frac{ A - \overline{A} }{ {\rm SD}(A) }, \ \ \frac{ B - \overline{B} }{ {\rm SD}(B) }$

其中的样本均值和标准差，对于 B 也是如此。变量的标准化版本被解释为高于/低于均值 a 的标准差数特别的观察是。 $\overline{A}, {\rm SD}(A)$ $A$

其它你可能感兴趣的问题