在我的硕士课程中,我了解到在构建 ML 模型时:
- 在训练集上训练模型
- 将其性能与验证集进行比较
- 调整设置并重复步骤 1-2
- 当您满意时,将最终模型与测试(保留)集进行比较
当我开始作为 DS 工作时,我提出了一个关于测试集和验证集大小的问题,因为看起来好像有人给它们贴错了标签。这引起了混乱,因为显然其他人都使用了第 2 步中的“测试”集,并为第 4 步保留了“验证”集。
我以为我学错了,没有造成任何伤害,因为我只是将术语转换为一致。但是,我在重新研究一些深度学习书籍时发现,根据 Keras 的创建者的说法,我一直都是对的!就在我写这个问题之前,我发现这个问题表明测试/验证集的其他定义是正确的......
这是约定好的事情吗?经典机器学习方法和深度学习从业者之间是否存在关于正确术语的分歧?据我所知,没有人真正讨论过一些统计学家/数据科学家如何对这两个术语使用完全相反的定义。