我目前正在尝试了解粒子过滤器及其在金融中的可能用途,但我正在苦苦挣扎。为了(i)使粒子过滤器的基础知识易于理解,以及(ii)以后彻底理解它们,我应该重新审视哪些数学和统计先决条件(来自量化金融背景)?我对研究生水平的时间序列计量经济学有扎实的了解,但我尚未涉及的状态空间模型除外。
任何提示都非常感谢!
我目前正在尝试了解粒子过滤器及其在金融中的可能用途,但我正在苦苦挣扎。为了(i)使粒子过滤器的基础知识易于理解,以及(ii)以后彻底理解它们,我应该重新审视哪些数学和统计先决条件(来自量化金融背景)?我对研究生水平的时间序列计量经济学有扎实的了解,但我尚未涉及的状态空间模型除外。
任何提示都非常感谢!
只需几个基本概念,您就可以取得惊人的成就。符号、变量的爆炸等等……会让事情看起来很复杂,但粒子过滤的核心思想非常简单。
您需要(并且可能已经这样做!)了解的一些基本概率:
第一的:
然后迭代以下步骤以从时间更新到时间:
初始化您的过滤器: - 查看您的位置,您所在的位置。现在闭上你的眼睛。
然后迭代:
重复!
实现所需的概率机制基本上只是基本概率:贝叶斯规则、计算边际分布等......
在某种意义上,步骤 (1) 和 (2) 对任何贝叶斯过滤问题都是通用的。一些高度相关的概念可能会阅读:
您应该首先了解更易于编码的状态空间模型和封闭式过滤(即卡尔曼过滤器、隐马尔可夫模型)。Matthew Gunn 是正确的,您可以通过简单的概念取得惊人的进展,但在我看来,您应该将其作为中间目标,因为:
1.) 相对而言,状态空间模型中的运动部件更多。当你学习 SSM 或隐马尔可夫模型时,会有很多符号。这意味着在您验证事物时,您的工作记忆中会保留更多的东西。就个人而言,当我第一次学习卡尔曼滤波器和线性高斯 SSM 时,我基本上在想“嗯,这只是多元法线向量的属性……我只需要跟踪哪个矩阵是哪个。” 此外,如果您在书籍之间切换,它们通常会更改符号。
后来我想“嗯,这只是每个时间点的贝叶斯规则”。一旦你这样想,你就会明白为什么共轭族很好,就像卡尔曼滤波器一样。当您编写具有离散状态空间的隐藏马尔可夫模型时,您会明白为什么不必计算任何可能性,并且过滤/平滑很容易。(我想我在这里偏离了传统的嗯行话。)
2.) 对其中的大量进行编码会让你意识到状态空间模型的定义是多么普遍。很快你就会写下你想使用的模型,同时看看为什么你不能。首先,您最终会发现您无法以您习惯的这两种形式之一写下来。当您再考虑一下时,您会写下贝叶斯规则,并发现问题在于您无法计算数据的某种可能性。
因此,您最终将无法计算这些后验分布(状态的平滑或过滤分布)。为了解决这个问题,有很多近似过滤的东西。粒子过滤只是其中之一。粒子过滤的主要内容:您可以从这些分布中进行模拟,因为您无法计算它们。
你是怎么模拟的?大多数算法只是重要性采样的一些变体。但它在这里也变得更加复杂。我推荐 Doucet 和 Johansen 的教程论文 ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf )。如果您了解封闭形式过滤的工作原理,他们会介绍重要性采样的一般概念,然后介绍蒙特卡罗方法的一般概念,然后向您展示如何使用这两个东西来开始一个不错的金融时间序列示例。恕我直言,这是我遇到的关于粒子过滤的最佳教程。
除了在混合中添加两个新想法(重要性采样和蒙特卡罗方法)之外,现在还有更多符号。您从现在开始采样的一些密度;有些你正在评估,当你评估它们时,你正在评估样本。结果,在你全部编码之后,是加权样本,被认为是粒子。它们在每次新观察后都会发生变化。一次完成所有这些将是非常困难的。我认为这是一个过程。
如果我给人的印象是神秘的或手摇的,我深表歉意。这只是我个人对该主题的熟悉程度的时间表。Matthew Gunn 的帖子可能更直接地回答了您的问题。我只是想我会扔掉这个回应。