如何使用与新数据预处理相同的比例。
实际代码:
x = df.values #returns a numpy array
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
df_scaled = pd.DataFrame(x_scaled)
clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
pred = clf.predict(X_test)
如果我理解正确,我应该在 StandardScaler 中包含一个缩放器变量。
就像是:
clf = tree.DecisionTreeClassifier()
clf.fit(X_train, y_train)
scaler = preprocessing.StandardScaler().fit(X_train)
pred = clf.predict(X_test)
我应该使用哪些缩放器参数来进行未来的数据处理?
谢谢!