注意 - 我已经阅读了这篇文章,但仍然不明白
我有一个朴素贝叶斯分类器,当我输入训练数据来测试准确率时,我得到了 63.05%。当我输入我的测试数据时,准确率为 65.00%。
为什么训练和测试的准确率几乎相同?有关信息,我的数据分为 70/30。这是否意味着没有过拟合?
注意 - 我已经阅读了这篇文章,但仍然不明白
我有一个朴素贝叶斯分类器,当我输入训练数据来测试准确率时,我得到了 63.05%。当我输入我的测试数据时,准确率为 65.00%。
为什么训练和测试的准确率几乎相同?有关信息,我的数据分为 70/30。这是否意味着没有过拟合?
为什么训练和测试的准确率几乎相同?
训练集和测试集上几乎相同的性能是一个好的结果,这意味着模型正在做它应该做的事情。进行直观的比较:
这是否意味着没有过拟合?
是的,它证明没有过拟合。为了与我的比较保持一致,过度拟合相当于记住答案。
但是,可能还有其他问题会影响结果:
[编辑] 重要说明:正如 Nikos 在下面的评论中解释的那样,我的回答假设您有一个适当的测试集,即训练集和测试集彼此足够不同(否则可能存在数据泄漏和测试集性能将毫无意义)。