交叉验证 Vs。训练验证测试(续)

数据挖掘 机器学习 交叉验证
2022-02-04 12:28:54

交叉验证 Vs。训练验证测试

在上面的帖子中,我还有一个与@louic 答案有关的问题:

“训练发生 k 次,每次都会忽略训练集的不同部分。通常,这些 k 模型的误差是平均的。这是针对要测试的每个模型参数以及具有最低误差的模型完成的被选中。”

当我们说“选择具有最低误差的模型”时,以下哪个是指:

  1. 我们选择具有最低平均误差的参数,然后从 K 个模型中找到具有绝对最低误差的模型
  2. 我们选择平均误差最低的参数,然后训练一个新模型——在整个训练集上,使用这些参数?
  3. 我们选择具有最低平均误差的参数,然后取训练好的 K 模型的平均权重谢谢

伊恩

1个回答

链接问题中的答案说使用方法2。具体来说:

  1. 对每个超参数值的选择分别在训练集上运行交叉验证。
  2. 在每次运行中,平均 k 折的分数以产生最终的交叉验证分数。
  3. 选择给我们最好的交叉验证分数的超参数。
  4. 在整个训练集上使用这些超参数重新训练模型。
  5. 在测试集上测试这个模型,直到现在完全没有使用过。