在推断测试集之前加入训练和验证集是否正确?

数据挖掘 机器学习 数据集 训练
2021-10-02 03:22:33

我想知道training-set.validation-settest-set

2个回答

是的,一旦您使用验证集优化了模型和参数,建议在将最终模型应用到测试集之前,先结合训练集和验证集对最终模型进行训练。实际上,您可以将验证集视为训练集的子集。它用于调整您的模型和参数,但是一旦完成,在测试阶段不使用验证集进行训练将是一种浪费。

请记住,一旦您在测试集上测试了模型,就不应再对其进行调整

理论上,您使用训练集来学习权重,使用验证集来调整网络架构,使用测试集来验证网络的泛化性。您可以在 数据科学文章中找到有关此内容的更多详细信息。只有测试集的准确性——在训练和架构调整期间都看不到——才能让你对自己的表现有一个公正的认识。

如果您现在想在新数据上使用您的模型 - 例如在生产中 - 您可以在训练 + 验证集上重新训练它。