这个例子中使用了什么朴素贝叶斯方法?

数据挖掘 Python 朴素贝叶斯分类器
2022-02-21 23:35:00

我在看一本老书,叫《数据挖掘实用机器学习与技术》;它还使用了一个名为 Weka 的工具来自动化示例,但我更喜欢使用 Python 来实现。

我对机器学习很陌生,我只是想用计算机 API 排列示例;我不确定示例中使用的朴素贝叶斯类型(我在书中的电子表格中实现)。从它的外观来看,基于书中的其他示例,它看起来不是多项式贝叶斯,但我似乎也找不到与之相符的 API。

该示例尝试根据 Outlook(晴天、阴天、下雨)、温度分类(热、温和、寒冷)、湿度分类(高、正常)来确定运动队是否会外出比赛(是、否)以及是否有风(真,假)。

这些值来自第 11 页的天气数据表 1.2 中的数据行。

INPUT 的处理开始,然后Table 4.2 The weather data with counts and probabilities它们根据可能的属性值和总数计算概率和总数。

然后,他们将新的一天行添加到输入和流程中,该行没有 Will the team play 值,但确实具有所有其他属性,每个属性都有一个值。计算是和否的可能性,然后在输出中计算一个概率值yes和一个值no

我在此处包含了电子表格。

我意识到这确实是基本的机器学习,但我只是想知道是否有人可以将我指向一个可以处理此类问题的 python 库或 python 算法......我实际上也试图让它在 Weka 中工作,并运行在一个类似的问题中,我似乎能够找到一个朴素贝叶斯算法,而无需在书中和我的电子表格中生成正确的结果。

那么这个特殊的朴素贝叶斯方法有名称和等效的 API 吗?

1个回答

此示例中使用了基本的朴素贝叶斯。每个特征可以有多个不同的值,范围为 2 或 3。

伯努利朴素贝叶斯要求每个特征都是真或假或 0 或 1。

多项朴素贝叶斯允许特征值为 0+,因为它正在计算特征的出现次数。

希望这可以帮助。朴素贝叶斯维基百科页面也很好地总结了这一点。