为什么卡尔曼滤波器是(动态)贝叶斯网络的一个特例?

机器算法验证 机器学习 贝叶斯网络 卡尔曼滤波器
2022-03-20 13:18:45

问:怎么会是这样?为什么卡尔曼滤波器比任何其他贝叶斯网络都复杂得多?是否有任何中等复杂度的贝叶斯网络?

也许回答这个问题的一种方法是陈述或引用最简单的卡尔曼滤波器模型。

背景:
我只熟悉关于连续时间静止随机过程的文献中的卡尔曼滤波器,其中它们似乎是我坦率地不理解的极其复杂的对象。根据LoeveShiryaev中给出的描述,它被称为 Kalman-Bucy 滤波器,与连续时间的信号处理和正交 Karhunen-Loeve 展开等主题更密切相关(我还是不明白)。

然而,我熟悉的所有其他贝叶斯网络都是离散时间、离散状态空间对象,人们可能可以在第一次介绍概率论的第一学期或第二学期了解这些对象。Shiryaev 中的 Kalman-Bucy 滤波器显然不是这样。

然而,维基百科指出卡尔曼滤波器是动态贝叶斯网络的一个特例。

1个回答

这句话不是指连续时间-连续观察卡尔曼-布西滤波器,而是指离散时间卡尔曼滤波器。混乱似乎只是由于 OP 不知道离散时间版本(根据我的经验,当提到“卡尔曼滤波器”时最常见的意思是)。例如,参见 Wikipedia 文章“卡尔曼滤波器”或 [1]。

在离散时间的情况下,节点的状态空间确实不是离散的,而是用于测量,而用于观察。然而,也有其他贝叶斯网络具有连续状态空间(对于变量)和高斯条件分布[例如 2]。RmRn

离散时间线性高斯动态系统模型可以写成如下的动态贝叶斯网络。

  • 时间片由节点组成,并且有一条从指向的边。kxkykxkyk
  • 跨期边缘从xkxk+1
  • 条件概率分布为之外的所有量都是已知矩阵。ykxk+1N(Akxk,Qk)ykxkN(Hkxk,Rk)x,y

卡尔曼滤波器是一种算法,用于在这个动态贝叶斯网络中给定观察到唯一需要的概率论是计算(有限维)多元高斯分布的条件分布。xky1,,yk

警告:也存在所谓的“连续时间贝叶斯网络”[3],但我不知道它们与 Kalman-Bucy 滤波器模型之间有任何联系。

参考

[1]:Simo Särkka(2013 年)。贝叶斯滤波和平滑。剑桥大学出版社。第 4.3 节。可在作者的网页上找到。(利益冲突免责声明:作者是我的博士生导师)

[2]: FV Jensen (2001), Bayesian Networks and Decision Graphs, Springer (p. 69)(奇怪的是,这本书第 65 页声称“卡尔曼滤波器”是任何隐马尔可夫模型,只有一个变量具有跨时关系' 但这绝对是非标准用法)

[3]:Nodelman, U.、Shelton, CR 和 Koller, D.(2002 年 8 月)。连续时间贝叶斯网络。在第十八届人工智能不确定性会议论文集中(第 378-387 页)。