用朴素贝叶斯补码分类 Texte

数据挖掘 机器学习 nlp 多类分类 文本分类 朴素贝叶斯分类器
2022-03-13 10:05:03

目前我正在进行一个文本分类项目,目标是根据 13 个类对一组 CV 进行分类。我使用贝叶斯算法(ComplementNB),在我的测试中,它是给出最高分的模型。问题是我没有超过 54% 的召回率,也没有超过 50% 的 F1 分数。我一开始就有班级不平衡的问题,而且我的课文也很相似,因此我的变量不是独立的。查看我的混淆矩阵,该模型倾向于对大多数类别中的大多数简历进行分类。是否有解决方案来增加我的 F1 分数,最重要的是应该为变量依赖问题做些什么?我想澄清一下,相同的文本 (CV) 最多可以有 4 个不同的类。

0个回答
没有发现任何回复~