当我阅读有关 using的信息StandardScaler
时,大多数建议都说您应该在将数据拆分为训练/测试StandardScaler
之前使用,但是当我检查在线发布的一些代码(使用 sklearn)时,有两个主要用途。
1- 使用StandardScaler
所有数据。例如
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
或者
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
或者干脆
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2-StandardScaler
在拆分数据上使用。
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
我想标准化我的数据,但我很困惑哪种方法最好!