在朴素贝叶斯分类器中使用核密度估计?

机器算法验证 贝叶斯 克德
2022-02-28 21:33:48

这个问题是我之前的问题here的后续问题, 并且在意图上也与这个问题有关

这个 wiki 页面上 ,来自训练集的假设正态分布的概率密度值用于计算贝叶斯后验,而不是实际概率值。但是,如果训练集不是正态分布的,那么使用从训练集的核密度估计中获取的密度值来计算贝叶斯后验是否同样有效?

在其预期应用中,该核密度估计将取自由 MC 技术生成的理论上理想的经验数据集。

1个回答

我已经阅读了第一个链接的早期问题,尤其是 whuber 的答案和对此的评论。

答案是肯定的,您可以这样做,即使用数字变量的 kde 中的密度作为条件概率(贝叶斯定理中的 P(X=x|C=c)P(C=c|X=x)=P(C=c)P(X=x|C=c)/P(X=x)

通过假设 d(height) 在所有类中相等,当应用该定理时,d(height) 被归一化,即当除以时。P(X=x|C=c)P(X=x)

这篇论文对你来说可能很有趣:估计贝叶斯分类器中的连续分布