马尔可夫链与贝叶斯网

数据挖掘 马尔科夫过程 贝叶斯网络
2022-02-27 01:53:22

我正在学习马尔可夫链和贝叶斯网络。然而,在这一点上,我对使用呈现给我们的两种不同模型对哪些类型的问题进行建模有点困惑。据我了解(主要来自我读过的示例)马尔可夫链被用来表示单一类型变量随时间的变化。例如,一个代表天气的随机变量 X。令 X = {sun, rain}。然后对于一个马尔可夫链,在时间 = 0 时,我们得到 P(X) 和一个转移模型P(Xt/Xt1). 所以有了这些知识,我们可以计算P(X). 就像问一个问题,给定一个随机变量 X 的初始分布和一个转移模型,在时间 t 的 P(X=x) 的值是多少?此类问题的解决方案可以通过迷你前向算法来回答。
现在对于贝叶斯网络,据我了解,我们对不同随机变量之间的依赖关系进行建模。所以这里本质上我们有一些随机变量可能与其他变量有因果关系。这种网络有一些很好的特性,可以让我们轻松地定义所有变量的联合。
关于我的问题-> 通常在贝叶斯网络之前介绍马尔可夫链的主题。两者之间有什么关系?因为我似乎无法在它们之间画出相似之处,所以对我来说,我认为这两种方法在建模完全不同的问题时都是完全不同的方法。
在哪些其他情况下可以使用马尔可夫链?还是它们总是用来模拟随时间步长变化的单个变量?我希望能够清楚地区分两者,并希望这能帮助我更好地理解这些主题!非常感谢任何建议/阅读/链接!

1个回答

首先,我不同意马尔可夫链正在处理“单一类型的变量”。如果您查看马尔可夫链的正式定义,您会看到变量X是随机变量。随机变量是在任意(嗯,可测量的)可能结果集上定义的。所以你的X不仅可以来自{sun,rain}集,但如果可以来自笛卡尔积{sun,rain}{windy,cloudy,calm}和温度从[60,60]间隔。

关于马尔可夫链和贝叶斯网络之间的关系,我想说有一个通用框架可以让您理解它们之间的关系(实际上,还有许多其他概率结构)。在所有情况下,我们都有一组随机变量——对于马尔可夫链,这些是X0,X1,X2对于贝叶斯网络,让我们打电话给他们A,B,C,D,E,F.

在这两种情况下,我们都对整个变量集合的概率分布感兴趣,称为联合概率分布

P(X0,X1,X2)andP(A,B,C,D,E,F)

问题在于,对于任何相当复杂的问题,试图表示这种分布(比如在计算机上)是不可能的——变量的可能组合的数量随着变量的数量呈指数增长。因此,我们正在想办法将这些关节分解为更小、更易于管理的乘数。

对于马尔可夫链,分解属性是

P(X0,X1,X2)=P(X1|X0)P(X2|X1)P(X3|X2)

对于贝叶斯网络,分解属性可能如下所示(对于我刚刚制作的特定依赖图):

P(A,B,C,D,E,F)=Pa(A)Pb(B)Pc(C|A)Pd(D|A,B)Pe(E|C,D)Pf(F|E)

在我看来,考虑联合分布,然后查看您的框架对其施加的分解结构是开始研究它的好地方。