数据挖掘 - 生成模型如何用于机器学习分类应用？ - 吾爱随笔录

生成模型如何用于机器学习分类应用？

数据挖掘机器学习分类生成模型

2022-03-14 04:29:12

我对生成模型的理解是它们生成数据以匹配某些统计属性。直觉上，我发现如何将生成模型用于分类目的很难。另一方面，用于分类的判别模型是不言自明的。

1个回答

您将在 Wikipedia 上找到解释。但让我们总结一下：

给定您的数据 $D$ 您对目标值感兴趣 $Y$ , 你的分类。正如您所说，判别模型是根据您的数据对目标对应关系进行建模的直接方法， $P(Y|D)$ . 另一方面，生成模型计算 $P(D|Y)$ .

让我们考虑电子邮件垃圾邮件过滤的示例。我们有一组参考电子邮件和每封邮件的标签，表明它是否是垃圾邮件。例如，如果我们现在看Naive Bayes，我们可以看到它利用贝叶斯公式来计算后验估计 $P(Y|X) = \frac{P(X|Y)P(X)}{P(Y)}$ . 与其他贝叶斯推理方法相反，朴素贝叶斯不成立 $P(X)$ 作为模特，但是 $P(X|Y)$ ，可以通过我们的参考电子邮件集进行建模。在这个域中，所有的电子邮件都可以建模为平均分布，从而使 $P(X)$ 无趣。 $P(Y)$ 也可以通过参考集来近似（只看标签）。

这样，我们可以为我们的标签生成概率 $Y$ ，在我们的例子中是二进制的。现在我们可以应用最大后验方法：我们计算 $P(Y=true|X)$ 和 $P(Y=false|X)$ 看看哪一个更有可能。最有可能的选项将被选为我们的分类。

其它你可能感兴趣的问题

上一篇什么是权重布局下一篇登录 DCG 指标的意义？