数据挖掘 - 如何使用验证集来减少过度拟合的朴素贝叶斯？ - 吾爱随笔录

数据挖掘交叉验证朴素贝叶斯分类器

2022-02-28 02:56:39

使用验证集减少过拟合的正确程序是什么？

假设我将数据拆分为 80:10:10（训练：验证：测试）。我在训练集上进行训练，然后获得 90% 的准确率。我将此模型应用于验证集，然后得到 20%。那我该怎么办？

如何使用验证集来减少过度拟合，尤其是参考朴素贝叶斯？

1个回答

这与您使用的算法无关。这是因为您从训练集中学到了很多细节，所以只需在循环中调整参数，每次都会计算训练和验证错误。在 NB 的情况下，在这个意义上你没有很多参数。可能可以检查功能而不是参数。然后查看验证错误最小的著名点。

不要使用固定拆分。对于循环中的每个计算 $n$ 时间分割+评估并取错误的平均值和标准。让您对结果的稳定性和算法的有效性有更好的印象。

其它你可能感兴趣的问题