为什么朴素贝叶斯算法做出特征相互独立的朴素假设?

数据挖掘 机器学习 可能性 朴素贝叶斯分类器
2021-10-06 17:42:40

Naive Bayes之所以称为朴素,是因为它假设特征彼此之间的相关性为零。它们彼此独立。为什么朴素贝叶斯要做出这样的假设?

3个回答

通过这样做,只需将每个特征的概率相乘即可轻松找到联合分布,而在现实世界中它们可能不是独立的,您必须找到正确的联合分布。由于这种简化,它是幼稚的。

朴素贝叶斯做出这样的假设是为了简化计算。您可以查看不做出此类假设的贝叶斯信念网络

只是为了完成给出的答案并在某些方面澄清它们:朴素贝叶斯的假设是特征在给定预测变量的情况下是条件独立的,而不是独立的。还要注意,即使这种简化对在许多情况下远离真实分布的特征的条件联合分布做出了幼稚的假设,但我们的目标不是估计概率,而是执行二元分类,为此,我们的简化策略可能就足够了。