Standardscaler() 不是标准缩放?

数据挖掘 Python 特征缩放
2022-03-08 19:18:56

我有以下管道:

estimators = []
estimators.append(('standardize', StandardScaler()))
prepare_data = Pipeline(estimators)

最初,数据看起来像

data_unstandardscaled

应用估计器/ StandardScaler()后

X_train = prepare_data.fit_transform(X_train_raw)

data_standardscaled

为什么现在的值大多/总是负数?

当我查看其中的另一个变量时,X_train它看起来应该(我猜):

data_unstandardscaled2

data_standardscaled2

1个回答

你有异常值。标准缩放器独立缩放每个属性,以零和单位方差为中心。要么处理你的异常值,要么使用一些更强大的缩放器。尝试用单独的箱线图绘制每个属性。