如何使用验证集来减少过度拟合的朴素贝叶斯?

数据挖掘 交叉验证 朴素贝叶斯分类器
2022-02-28 02:56:39

使用验证集减少过拟合的正确程序是什么?

假设我将数据拆分为 80:10:10(训练:验证:测试)。我在训练集上进行训练,然后获得 90% 的准确率。我将此模型应用于验证集,然后得到 20%。那我该怎么办?

如何使用验证集来减少过度拟合,尤其是参考朴素贝叶斯?

1个回答

这与您使用的算法无关。这是因为您从训练集中学到了很多细节,所以只需在循环中调整参数,每次都会计算训练和验证错误。在 NB 的情况下,在这个意义上你没有很多参数。可能可以检查功能而不是参数。然后查看验证错误最小的著名点。

不要使用固定拆分。对于循环中的每个计算n时间分割+评估并取错误的平均值和标准。让您对结果的稳定性和算法的有效性有更好的印象。