测试时间是用测试数据集计算模型准确性的阶段吗?

人工智能 机器学习 训练 定义 测试
2021-11-03 19:27:28

当论文谈论“测试时间”时,这是否意味着模型通过新数据实例以得出测试数据集准确性的阶段?或者“测试时间”是模型完全训练并针对真实世界输入数据启动的阶段?

1个回答

如果未另行定义,则测试是模型通过新数据实例以得出测试集分数的阶段。它不应该与验证集混淆。

验证数据集是训练模型时保留的数据样本,用于在训练期间调整模型的超参数时估计模型技能。有很多验证方法,其中 k 折交叉验证是最受欢迎的方法之一。

在 k 折交叉验证中,原始训练集被随机划分为 k 个大小相等的子样本。在 k 个子样本中,保留单个子样本作为验证数据用于验证模型,剩余的 k-1 个子样本用作训练数据。然后将交叉验证过程重复 k 次,每个 k 子样本只使用一次作为每个 epoch 的验证数据。然后可以对 k 个结果进行平均以产生单个估计。这种方法相对于重复随机子抽样的优点是所有的观察都用于训练和验证,每个观察只用于验证一次。

验证数据集不同于也受模型训练阻碍的测试集,而是用于在比较或选择最终模型时对最终调整模型的技能进行无偏估计。