我遇到了这种流程图:
在流程图下方,出现以下内容:
“给定一个训练集,为调整参数 (λ,d) 的每个配置计算交叉验证误差。选择具有最低总体交叉验证误差的调整参数的配置是最好的,因为它会导致最好的模型性能。使用调整参数的最佳配置,然后我们在原始训练集上训练模型 M2 和 M3,并使用原始测试集计算相应的测试 RMSE。”
- 他们只提到了交叉验证错误(validation),从来没有提到火车交叉验证错误。
- 短语“选择具有最低总体交叉验证误差的调整参数配置是最好的,因为它会导致最好的模型性能”正确吗?我的意思是,假设“最低的整体交叉验证错误导致最好的模型性能”,他们指的是交叉验证技术的“验证”错误,我想知道他们为什么会做出这样的假设?我们应该关心平均列车交叉验证误差还是只关心平均验证误差?
我正在使用一个库来玩推荐系统,它有一个名为return_train_measures = True的参数。然后它会同时抛出训练和测试错误:

