我正在对 7000 行数据集进行回归分析,训练/测试拆分为 70%/30%。我正在使用一个变量X来预测一个变量Y。
X范围在 300 到 810 之间(平均 712)。Y是一个整数(出现次数),范围在 0 到 20 之间(平均值 0.2)。
如果没有标准化或规范化X,我会收到:
Train score: 0.082
Test score: 0.077
然而,在规范化 ( X = (X-X.min())/(X.max()-X.min())) 时,我收到:
Train score: 0.0000
Test score: -0.0001
对 Lasso 回归进行归一化有什么不正确的地方吗?这同样适用于标准化数据。有人能就最佳行动方案给我建议吗?