朴素贝叶斯分类器是分类问题的流行选择。造成这种情况的原因有很多,包括:
- “时代精神”——大约十年前垃圾邮件过滤器成功后的广泛认识
- 容易写
- 分类器模型构建速度快
- 可以使用新的训练数据修改模型,而无需重建模型
然而,它们是“幼稚的”——即它们假设特征是独立的——这与其他分类器如最大熵分类器(计算速度慢)形成对比。
通常不能假设独立性假设,并且在许多(大多数?)情况下,包括垃圾邮件过滤器示例,它完全是错误的。
那么为什么朴素贝叶斯分类器在这样的应用程序中仍然表现得非常好,即使特征不是相互独立的呢?