由于 NB 是一个生成分类器,我们假设数据点都是从一个分布中生成的,对吧?
但是由于我们可以通过计算 ( p(x_i|y)的 MLE = # of (x_i,y) / # of y) 来计算 p(x_i|y) 的 MLE,所以我们真的需要一个特定的分布吗? , 对可能性进行建模(p(x_i|y))?
由于 NB 是一个生成分类器,我们假设数据点都是从一个分布中生成的,对吧?
但是由于我们可以通过计算 ( p(x_i|y)的 MLE = # of (x_i,y) / # of y) 来计算 p(x_i|y) 的 MLE,所以我们真的需要一个特定的分布吗? , 对可能性进行建模(p(x_i|y))?
最令人痛心的问题是“插值”。也就是说,计算为了和您尚未观察到,但属于您观察的凸包。
您必须将事件组合在一起,或者想出一个古怪的插值方案。这确实有效。但是,如果您假设一个分布,变得连续,你最终得到了一种更统计合理的插值方法。