最近我正在处理一些算法的分类问题,比如逻辑回归。
当我预处理我的数据时,我会标准化我的所有特征,然后基于它们生成多项式特征。
from sklearn.preprocessing import PolynomialFeatures, StandardScaler
我愿意
# features is my entire features dataset, labels excluded
features = poly.fit_transform(features)
features = std.fit_transform(features)
完成模型训练后,准确率约为 80%。然后我将两行预处理代码反转为
features = std.fit_transform(features)
features = poly.fit_transform(features)
我已经阅读了这篇文章,但似乎答案不足以帮助我弄清楚。
我应该先标准化我的数据还是先从原始特征生成多项式?