我正在研究文本分类问题,并计划使用基于朴素贝叶斯的模型。
在哪些情况下我应该考虑使用多项朴素贝叶斯?
我正在研究文本分类问题,并计划使用基于朴素贝叶斯的模型。
在哪些情况下我应该考虑使用多项朴素贝叶斯?
对于文本分类,多项朴素贝叶斯是一个不错的选择。
我们可以从 MNB 开始,当
1. There is no dependence between the predictors
2. Good if class is not unblanced
(这是一种使用MNB处理不平衡数据的方法)
我会从词袋开始,然后是 TFIDF 向量,以检查模型性能,然后再进一步。