下面是 x,y 的虚拟散点图示例,其中BLUE (0)和RED(1) 是“目标”。黄点是我的输入,我在问这是或者的预测是BLUE (0)什么RED(1)
BLUE (0)
RED(1)
通过使用高斯朴素贝叶斯 (GaussianNB),我得到 0 的预测,概率为 99.99%(有意义)
现在,当我使用伯努利朴素贝叶斯 (BernoulliNB) 时,我得到 RED(1) 的预测,概率为 0.4202。(顺便说一句,Multinominal NB 也关闭:0.57%)
问题:
伯努利朴素贝叶斯仅适用于二元特征。类似地,多项朴素贝叶斯将特征视为事件概率。您的示例是针对非二进制实值特征给出的( x , y)(x,y), 不完全位于区间内[ 0 , 1 ][0,1],因此这些模型不适用于您的特征。
Bernoulli 或多项式 NB 的一个典型示例(取自 wiki 页面)是文档分类,其中特征表示术语的存在(在 Bernoulli 情况下)或术语的概率(在多项式情况下)。
伯努利非常适合用于不连续变化,尤其是二进制格式的特征,例如虹膜、指纹、血液等。而高斯则适用于正态分布或年龄、身高、大小等连续变化。