朴素贝叶斯分类器的起源?

机器算法验证 朴素贝叶斯 历史
2022-03-13 12:57:38

我在 Google Scholar 中寻找最早提到这个特定分类器的地方,但没有找到明确的来源。我看到一些消息来源引用到 1980 年代和其他早在 1930 年代。有谁知道朴素贝叶斯分类器是何时开发和/或首次用作分类技术的?

2个回答

朴素贝叶斯分类器是基于应用贝叶斯定理和强(朴素)独立假设的简单概率分类器。

贝叶斯定理以托马斯贝叶斯牧师 (1702-61) 命名,他研究了如何计算二项分布的概率参数的分布。贝叶斯去世后,他的朋友理查德·普赖斯在 1763 年编辑并展示了这部作品,作为《解决机会学说中的问题的论文》。

所以可以肯定地说,贝叶斯分类器自 18 世纪下半叶就已经存在。

特别是正如斯蒂芬·斯蒂格勒(Stephen M. Stigler,1983 年,“谁发现了贝叶斯定理?”美国统计学家 37(4):290-296)所建议的那样,贝叶斯定理是由尼古拉斯·桑德森在贝叶斯之前一段时间发现的。另一方面,Edwards (1986) 对这种解释提出异议(1986 年,AWF Edwards,“Hartley (1749) 中的参考文献是否指向贝叶斯推理?”,The American Statistician 40(2):109-110)。

这让我们再次回到“18 世纪下半叶”的安全假设,因为朴素贝叶斯分类器是基于应用贝叶斯定理的简单概率分类器......这使得它“朴素”是因为它具有强大的(天真的)独立性假设。但实际上,它是相同的定理。

我之前看过以下关于朴素贝叶斯的论文:

Hand, DJ 和 Yu, K. (2001)。白痴的贝叶斯——毕竟不是那么愚蠢吗?国际统计评论69 (3), 385-398。

这是对该主题的一些回顾和讨论。