人工智能 - 如果使用 k 折交叉验证的先前迭代的权重来播种神经网络分类器，我会过度拟合吗？ - 吾爱随笔录

人工智能神经网络机器学习分类训练 Python

2021-11-17 23:13:45

按照传统做法，我使用 k 折交叉验证来选择和优化我的神经网络分类器的超参数。当需要存储最终模型以供未来预测时，我发现使用先前 k 倍 cv 迭代的权重在后续迭代中播种模型的初始权重有助于提高准确性（似乎很明显）。我可以使用最终迭代中的模型对看不见的数据进行未来预测。

（请注意，我在此过程中使用了所有可用数据，并且我没有任何保留数据用于验证。）

1个回答

直接回答您的问题：估计模型在以前用于拟合的数据上的性能会高估性能。

当您的数据集“小”时，您将面临关于应该将多少数据用于训练和测试集的偏差方差困境：

K-fold CV 是评估某些程序性能的折衷方案。一旦您确定了某个模型或超参数，在进入生产阶段时，您可以：

选择采用您训练过的 k 个模型之一，可能使用“一个标准变化经验法则”。

其它你可能感兴趣的问题