我可以在 Logisitc Lasso 回归之前使用 StandardScaler 重新缩放 TF 矩阵或 TF-IDF 矩阵吗?

数据挖掘 Python 特征缩放 tfidf 套索
2022-03-03 10:53:45

我正在尝试使用 Logistic Lasso 将文档分类为 1 或 0。

我尝试使用文档的 TF 矩阵和 TF-IDF 矩阵表示作为我的预测变量。我发现,如果我在 Lasso 之前的矩阵上使用 Python 中的 StandardScaler 函数(通过移除均值和缩放到单位方差来标准化特征),则模型性能在这两种情况下都会提高。

在 Logistic Lasso 之前使用 StandardScaler 重新缩放 TF 或 TF-IDF 矩阵是否可以接受?为什么或者为什么不?

0个回答
没有发现任何回复~