我有一些数据,我想用这些数据建立一个模型(比如线性回归模型)。在下一步中,我想在模型上应用 Leave-One-Out Cross-Validation (LOOCV),看看它的性能如何。
如果我对 LOOCV 的理解正确,我会使用除此样本(训练集)之外的每个样本为我的每个样本(测试集)构建一个新模型。然后我使用模型来预测测试集并计算错误.
在下一步中,我汇总使用所选函数生成的所有错误,例如均方误差。我可以使用这些值来判断模型的质量(或拟合优度)。
问题:这些质量值适用于哪个模型,那么如果我发现从 LOOCV 生成的指标适合我的案例,我应该选择哪个模型?LOOCV 看着不同的模型(其中是样本量);我应该选择哪一个模型?
- 是使用所有样本的模型吗?在 LOOCV 过程中从未计算过此模型!
- 是误差最小的模型吗?