使用验证集减少过拟合的正确程序是什么?
假设我将数据拆分为 80:10:10(训练:验证:测试)。我在训练集上进行训练,然后获得 90% 的准确率。我将此模型应用于验证集,然后得到 20%。那我该怎么办?
如何使用验证集来减少过度拟合,尤其是参考朴素贝叶斯?
使用验证集减少过拟合的正确程序是什么?
假设我将数据拆分为 80:10:10(训练:验证:测试)。我在训练集上进行训练,然后获得 90% 的准确率。我将此模型应用于验证集,然后得到 20%。那我该怎么办?
如何使用验证集来减少过度拟合,尤其是参考朴素贝叶斯?
这与您使用的算法无关。这是因为您从训练集中学到了很多细节,所以只需在循环中调整参数,每次都会计算训练和验证错误。在 NB 的情况下,在这个意义上你没有很多参数。可能可以检查功能而不是参数。然后查看验证错误最小的著名点。
不要使用固定拆分。对于循环中的每个计算时间分割+评估并取错误的平均值和标准。让您对结果的稳定性和算法的有效性有更好的印象。