我正在对一个包含 110 行和 7 列的数据集应用回归,每个数据集都有目标。当我对数据应用 Lasso 回归并计算 RMSE 值时,RMSE 值为13.11. 我认为 RMSE 值应该接近于零。回归模型中 RMSE 的允许值是多少?计算中可能出了什么问题?
我的代码:
from sklearn import linear_model
reg = linear_model.Lasso(alpha = .00001)
reg.fit(Xt,Yt)
ans=reg.predict(Xts)
print(ans)
from sklearn.metrics import mean_squared_error
print(mean_squared_error(Yts, ans))
而当我尝试交叉验证时,MSE 分数远低于0.35
kfold = KFold(n_splits=10)
results = cross_val_score(reg, full_data, target, cv=kfold)
print("Results: %.2f (%.2f) MSE" % (results.mean(), results.std()))
results
Results: -0.13 (0.45) MSE