如何对不同尺度的两个变量求和?

机器算法验证 分布
2022-03-12 07:48:01

如果我有两个变量遵循两个不同的分布并且具有不同的标准偏差......我需要如何转换两个变量,以便当我将两个结果相加时不会被更不稳定的结果“驱动”。

例如... 变量 A 的波动性低于变量 B(范围从 0 到 3000)并且变量 B 来回波动。300 到 350。

如果简单地将两个变量加在一起,结果显然是由 A 驱动的。

1个回答

一个常见的做法是标准化这两个变量,A,B,通过减去样本均值并除以样本标准差,将它们放在相同的比例上。完成此操作后,两个变量将在同一尺度上,因为它们每个的样本均值为 0,样本标准差为 1。因此,它们可以在没有一个变量的情况下添加,而不会产生不适当的影响,这仅仅是因为规模。

也就是说,计算

AA¯SD(A),  BB¯SD(B)

其中的样本均值和标准差,对于 B 也是如此。变量的标准化版本被解释为高于/低于均值 a 的标准差数特别的观察是。 A¯,SD(A)A