将数据转换为所需的均值和标准差

机器算法验证 数据转换 标准差 意思是
2022-01-25 18:35:19

我正在寻找一种方法来将我的数据集从其当前均值和标准差转换为目标均值和目标标准差。基本上,我想缩小/扩大分散并将所有数字缩放到一个平均值。

做两个单独的线性变换是行不通的,一个是标准差,一个是平均值。我应该使用什么方法?

2个回答

假设您以均值和非零标准差 ,并且您希望获得具有均值和标准差的类似集合。{xi}m1s1m2s2

然后将所有值乘以s2s1将给出一个均值的集合m1×s2s1和标准差s2.

现在添加m2m1×s2s1将给出一个均值的集合m2和标准差s2.

所以新的一套{yi}

yi=m2+(xim1)×s2s1
有意思m2和标准差s2.

您将通过三个步骤得到相同的结果:将平均值转换为0,缩放到所需的标准偏差;转换为所需的平均值。

让我们考虑数据的z-score计算xi平均x¯和标准差sx.

zi=xix¯sx

这意味着,给定一些数据(xi),我们可以转换为数据,均值为0和标准差1.

重新排列,我们得到:

xi=zisx+x¯

这让我们用原始平均值返回原始数据x¯和标准差sx. 但我们可以去数据yi无论如何y¯和标准差sy.

yi=zisy+y¯

现在结合这两个变换,首先zi然后到yi.

yi=xix¯sxsy+y¯

这与亨利发布的内容相同,但我确实认为看到我们到达那里是有帮助的,首先是标准化数据,然后转换为具有我们想要的均值和标准差值的数据。