我正在从事一项新工作,这将使我有机会做一些很酷的机器学习工作。自从读研究生以来,我还没有更深入地接触过这些东西,我想对一些概念进行一些澄清。
我学习 ML 的方式是将数据 (80/20) 拆分为训练和验证数据集。您将模型拟合到 80% 的训练拆分,并通过交叉验证获得错误率、损失等。然后,您使用您使用训练数据构建的拟合模型并弹出 20% 的验证数据集,以比较错误率、损失等是否相似。如果是这样,模型是好的。
我一直在做一些研究以更新我的知识,并且我现在注意到通常是(70/20/10)的 3 向拆分(训练/测试/验证)。我很困惑这种 3 路拆分与我在学校教的 2 路拆分有何不同。另外,我很确定在提到 2-way split 方法时,我一直在将测试与验证互换。
有人可以验证我对 2-way split 的理解是否正确并解释它与 3-way split 之间的区别吗?
谢谢!