何时使用伯努利朴素贝叶斯?

机器算法验证 机器学习 Python 朴素贝叶斯
2022-04-21 12:05:36

下面是 x,y 的虚拟散点图示例,其中BLUE (0)RED(1) 是“目标”。黄点是我的输入,我在问这是或者的预测是BLUE (0)什么RED(1)

通过使用高斯朴素贝叶斯 (GaussianNB),我得到 0 的预测,概率为 99.99%(有意义)

现在,当我使用伯努利朴素贝叶斯 (BernoulliNB) 时,我得到 RED(1) 的预测,概率为 0.4202。(顺便说一句,Multinominal NB 也关闭:0.57%)

问题:

  1. 什么时候会使用伯努利朴素贝叶斯(欣赏一个例子)和
  2. 为什么在这种情况下,伯努利的预测如此偏离?

在此处输入图像描述

2个回答

伯努利朴素贝叶斯仅适用于二元特征。类似地,多项朴素贝叶斯将特征视为事件概率。您的示例是针对非二进制实值特征给出的(x,y), 不完全位于区间内[0,1],因此这些模型不适用于您的特征。

Bernoulli 或多项式 NB 的一个典型示例(取自 wiki 页面)是文档分类,其中特征表示术语的存在(在 Bernoulli 情况下)或术语的概率(在多项式情况下)。

伯努利非常适合用于不连续变化,尤其是二进制格式的特征,例如虹膜、指纹、血液等。而高斯则适用于正态分布或年龄、身高、大小等连续变化。