我在看一本老书,叫《数据挖掘实用机器学习与技术》;它还使用了一个名为 Weka 的工具来自动化示例,但我更喜欢使用 Python 来实现。
我对机器学习很陌生,我只是想用计算机 API 排列示例;我不确定示例中使用的朴素贝叶斯类型(我在书中的电子表格中实现)。从它的外观来看,基于书中的其他示例,它看起来不是多项式贝叶斯,但我似乎也找不到与之相符的 API。
该示例尝试根据 Outlook(晴天、阴天、下雨)、温度分类(热、温和、寒冷)、湿度分类(高、正常)来确定运动队是否会外出比赛(是、否)以及是否有风(真,假)。
这些值来自第 11 页的天气数据表 1.2 中的数据行。
INPUT 的处理开始,然后Table 4.2 The weather data with counts and probabilities它们根据可能的属性值和总数计算概率和总数。
然后,他们将新的一天行添加到输入和流程中,该行没有 Will the team play 值,但确实具有所有其他属性,每个属性都有一个值。计算是和否的可能性,然后在输出中计算一个概率值yes和一个值no。
我在此处包含了电子表格。
我意识到这确实是基本的机器学习,但我只是想知道是否有人可以将我指向一个可以处理此类问题的 python 库或 python 算法......我实际上也试图让它在 Weka 中工作,并运行在一个类似的问题中,我似乎能够找到一个朴素贝叶斯算法,而无需在书中和我的电子表格中生成正确的结果。
那么这个特殊的朴素贝叶斯方法有名称和等效的 API 吗?