我一直在使用图书馆的StandardScaler功能。sklearn你能告诉我它是如何对分布进行归一化以将其转换为高斯分布的吗?
使用 scikit-learn 库的 StandardScaler 函数
机器算法验证
正态分布
Python
scikit-学习
标准化
2022-03-23 04:18:39
2个回答
库中的StandardScaler函数sklearn实际上不会将分布转换为高斯或正态分布。当分布值之间存在较大差异时使用它。它只是一种特征缩放方法,用于标准化分布,使值位于同一范围内。
它从每个值中减去分布的平均值,然后除以标准差,从而得到平均值 = 0 和标准差 = 1 的分布,这不一定是正态分布。它仍然是非高斯的。
类似地,MinMaxScaler是另一个对特征进行缩放和变换的函数,这些特征可以位于给定范围内,例如默认范围 (0, 1)。
不仅限于 scikit-learn,标准化不会将特征/变量转换为正态分布。它只是减去平均值并除以标准偏差。结果特征将具有均值和方差。这与正态分布无关。
本质上,以下仿射变换不会将随机变量转换为正常的 RV: