我假设我们大多数人都知道交叉验证并且习惯于使用训练集和测试集。但是,我还看到了对用于测试已完成模型的第三组的引用。这是一个测试,看看你的模型如何处理它以前从未见过的数据集;有助于确定您的模型是否过度适合训练数据。
我已经看到这个数据集引用了“第三个数据集”、“野生数据集”、“真实世界数据集”中的所有内容。那么第三个数据集的合适名称是什么?
我假设我们大多数人都知道交叉验证并且习惯于使用训练集和测试集。但是,我还看到了对用于测试已完成模型的第三组的引用。这是一个测试,看看你的模型如何处理它以前从未见过的数据集;有助于确定您的模型是否过度适合训练数据。
我已经看到这个数据集引用了“第三个数据集”、“野生数据集”、“真实世界数据集”中的所有内容。那么第三个数据集的合适名称是什么?
好吧,我不会将您定义为“测试”的这个“测试”集称为“测试”!我会说:训练、验证、测试。而这个“测试”是你的模型还没有看到的数据集。这是非常标准的,甚至在 Andrew Ng 课程中也有详细解释,例如关于拆分数据及其分布的重要性的非常有用且重要的课程。