生成模型如何用于机器学习分类应用?

数据挖掘 机器学习 分类 生成模型
2022-03-14 04:29:12

我对生成模型的理解是它们生成数据以匹配某些统计属性。直觉上,我发现如何将生成模型用于分类目的很难。另一方面,用于分类的判别模型是不言自明的。

1个回答

您将在 Wikipedia 上找到解释但让我们总结一下:

给定您的数据D您对目标值感兴趣Y, 你的分类。正如您所说,判别模型是根据您的数据对目标对应关系进行建模的直接方法,P(Y|D). 另一方面,生成模型计算P(D|Y).

让我们考虑电子邮件垃圾邮件过滤的示例。我们有一组参考电子邮件和每封邮件的标签,表明它是否是垃圾邮件。例如,如果我们现在看Naive Bayes,我们可以看到它利用贝叶斯公式来计算后验估计P(Y|X)=P(X|Y)P(X)P(Y). 与其他贝叶斯推理方法相反,朴素贝叶斯不成立P(X)作为模特,但是P(X|Y),可以通过我们的参考电子邮件集进行建模。在这个域中,所有的电子邮件都可以建模为平均分布,从而使P(X)无趣。P(Y)也可以通过参考集来近似(只看标签)。

这样,我们可以为我们的标签生成概率Y,在我们的例子中是二进制的。现在我们可以应用最大后验方法:我们计算P(Y=true|X)P(Y=false|X)看看哪一个更有可能。最有可能的选项将被选为我们的分类。