贝叶斯网络与关联规则

机器算法验证 机器学习 数据挖掘 贝叶斯网络 先验的
2022-04-06 00:14:44

Apriori 算法找到了一些蕴含规则。

贝叶斯网络提供了类似的结果。

本质区别是什么?有哪些具体的优势/劣势?

编辑: Apriori 算法生成关联规则作为一种暗示,如下图所示(取自本文)。 在此处输入图像描述

1个回答

这个问题类似于以下问题:参数模型与非参数模型有什么区别。

  • 贝叶斯网络可以看作是参数模型。我们对随机变量和随机变量之间的依赖关系有明确的假设(假设我们只做参数学习没有结构学习)。

  • Apriori 算法是一种“数据挖掘”算法,这意味着它将以有效的算法给出所有模式,而不是真正的“机器学习”,即学习/调整某些参数以优化某些目标函数。

  • 哪个更好?还是利弊?就像关于参数模型与非参数模型的讨论一样。如果贝叶斯网络假设很好,那么它会“更好”。另一方面,如果假设不准确,先验可能会更好。


此外,贝叶斯网络和 Apriori 算法的使用方式不同。

  • 贝叶斯网络主要用于“推理”。我们可以问贝叶斯网络的问题就像“如果我知道 A 和 B 发生了,C 发生而 D 不发生的几率是多少”?该模型将给出查询的概率。

  • Apriori算法用于获取满足条件的频繁项集。典型的问题是“什么是频繁出现的项目”,这与贝叶斯网络中提到的条件概率查询不同。

  • 通俗地说,我们可以认为 Apriori 是在尝试提出关于联合概率的问题并存储所有高频组合。另一方面,贝叶斯网络试图提出关于条件概率的问题:给定数据,哪个假设更有可能。