数据挖掘 - 如何对新数据使用相同的比例？- scikit 学习 - scikit 学习 - 吾爱随笔录

如何使用与新数据预处理相同的比例。

实际代码：

x = df.values #returns a numpy array
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
df_scaled = pd.DataFrame(x_scaled)

clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
pred = clf.predict(X_test)

如果我理解正确，我应该在 StandardScaler 中包含一个缩放器变量。

https://stackoverflow.com/questions/38780302/predicting-new-data-using-sklearn-after-standardizing-the-training-data

就像是：

clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
scaler = preprocessing.StandardScaler().fit(X_train)
pred = clf.predict(X_test)

我应该使用哪些缩放器参数来进行未来的数据处理？

谢谢！