朴素贝叶斯分类器是否需要假设特定的训练分布?

数据挖掘 机器学习 朴素贝叶斯分类器
2022-02-16 08:28:22

由于 NB 是一个生成分类器,我们假设数据点都是从一个分布中生成的,对吧?

但是由于我们可以通过计算 ( p(x_i|y)的 MLE = # of (x_i,y) / # of y) 来计算 p(x_i|y) 的 MLE,所以我们真的需要一个特定的分布吗? , 对可能性进行建模(p(x_i|y))?

1个回答

最令人痛心的问题是“插值”。也就是说,计算p(xi|y)为了xiy您尚未观察到,但属于您观察的凸包。

您必须将事件组合在一起,或者想出一个古怪的插值方案。确实有效。但是,如果您假设一个分布,p(xi|y)变得连续,你最终得到了一种更统计合理的插值方法。