机器算法验证 - 使用 scikit-learn 库的 StandardScaler 函数 - 吾爱随笔录

机器算法验证正态分布 Python scikit-学习标准化

2022-03-23 04:18:39

我一直在使用图书馆的StandardScaler功能。sklearn你能告诉我它是如何对分布进行归一化以将其转换为高斯分布的吗？

2个回答

库中的StandardScaler函数sklearn实际上不会将分布转换为高斯或正态分布。当分布值之间存在较大差异时使用它。它只是一种特征缩放方法，用于标准化分布，使值位于同一范围内。

它从每个值中减去分布的平均值，然后除以标准差，从而得到平均值 = 0 和标准差 = 1 的分布，这不一定是正态分布。它仍然是非高斯的。

类似地，MinMaxScaler是另一个对特征进行缩放和变换的函数，这些特征可以位于给定范围内，例如默认范围 (0, 1)。

不仅限于 scikit-learn，标准化不会将特征/变量转换为正态分布。它只是减去平均值并除以标准偏差。结果特征将具有均值和方差。这与正态分布无关。 $0$ $1$

本质上，以下仿射变换不会将随机变量转换为正常的 RV：

Z = \frac{X - μ}{σ}

$Z=\frac{X-\mu}{\sigma}$

其它你可能感兴趣的问题