了解粒子过滤器的数学和统计学先决条件?


10

我目前正在尝试了解粒子过滤器及其在金融中的可能用途,并且我在相当努力。为了(i)使粒子过滤器的基础变得易于使用,以及(ii)以后再全面理解它们,我应该重新讨论哪些数学和统计先决条件(来自定量金融的背景)?除了状态空间模型(我尚未介绍)以外,我对研究生级时间序列计量经济学有扎实的知识。

任何提示都非常感谢!


4
贝叶斯统计对这个问题很重要。你不需要知道了一堆,就一定要了解它(如在此之前,可能性后),他们从模型假设是如何产生的相关条款
亚伊尔Daon公司

1
我认为阅读Doucet的论文是一个好主意,他是一位非常好的作家。在他的网站上,他提供了包括幻灯片/讲座和视频在内的全面资源清单!他还列出了他的一位同事的另一份详尽的清单
bdeonovic

Answers:


9

仅需几个基本概念,您就可以得到令人震惊的结果。表示法,变量的爆炸式增长等可能会使事情看起来复杂,但是粒子过滤的核心思想非常简单。

您需要(可能已经知道!)的一些基本概率:

  • 计算边际分布PX=X=一世PX=Xÿ=ÿ一世
  • 防御 条件概率:PXÿ=PXÿPÿ
  • 贝叶斯规则:PXÿ=PÿXPXPÿ
  • 贝叶斯术语:例如。先验,可能性,后验(我同意+1 @Yair Daon!)

粒子过滤器的基本步骤非常简单:

第一:

  • 从关于某种隐藏状态的一些信念开始。例如,您可能首先相信您的火箭在发射台上。(在粒子过滤器中,关于隐藏状态的信念将用点云表示,每个点表示隐藏状态的可能值。每个点还与状态为真实状态的概率相关。)

然后,您迭代以下步骤以从时间更新到时间:ŤŤ+1个

  1. 预测步骤:根据运动定律向前移动位置。(例如,根据火箭当前的速度,轨迹等向前移动点)。随着不确定性的增加,这通常会扩展出点云。
  2. 概率更新步骤:使用数据,传感器输入来使用贝叶斯规则更新与点关联的概率。随着不确定性的降低,这通常会使点云崩溃。
  3. 添加一些特定于粒子过滤的步骤/技巧。例如。:
    • 有时会对您的点重新采样,以使每个点都具有相等的概率。
    • 混入一些噪声,防止您的概率步骤(2)过多地折叠点云(在粒子滤波中,重要的是在您的真实位置至少有一个点具有隐含的正概率!)

例:

初始化过滤器:-查看您所处的位置。现在闭上你的眼睛。

然后重复:

  1. 闭上眼睛向前走一步。
  2. 预测步骤:鉴于过去在哪里,你的信念站立,预测你在哪里,现在站在给出向前迈进了一步。(请注意,不确定性会如何扩展,因为您闭着眼睛前进并不十分精确!)
  3. 更新步骤:使用传感器(例如,周围的感觉等)更新您对自己站立位置的看法。

重复!

实施所需的概率机制基本上只是基本概率:贝叶斯规则,计算边际分布等。

高度相关的想法可能有助于理解全局:

从某种意义上说,步骤(1)和(2)对于任何贝叶斯滤波问题都是通用的。一些高度相关的概念可能需要阅读:

  • 隐马尔可夫模型。如果在给定当前状态的情况下过去与将来无关,那么流程就是马尔可夫。几乎任何时间序列都被建模为某种马尔可夫过程。一个马尔可夫模型是一个其状态还没有直接观察(如:你从来没有直接观察你的火箭的确切位置,而是通过贝叶斯过滤器推断出它的位置)。
  • 卡尔曼滤波。这是常用粒子过滤的替代方法。它基本上是贝叶斯过滤器,其中所有内容均假定为多元高斯。

2

您应该先学习易于编码的状态空间模型,然后再学习封闭形式的过滤(例如,卡尔曼过滤器,隐马尔可夫模型)。马修·冈恩(Matthew Gunn)是对的,您可以通过简单的概念取得令人惊讶的成就,但是在我拙见中,您应该将其作为一个中间目标,因为:

1.)相对而言,状态空间模型中有更多的运动部件。当您学习SSM或隐藏的markov模型时,会有很多表示法。这意味着在您进行验证时,还有更多的东西要保存在您的工作记忆中。就我个人而言,当我首先学习卡尔曼滤波器和线性高斯SSM时,我基本上是在思考:“这只是多元法向向量的性质,我只需要跟踪哪个矩阵是哪个。” 另外,如果要在书籍之间切换,它们通常会更改表示法。

之后,我想到了“嗯,这在每个时间点都只是贝叶斯的法则”。一旦以这种方式想到它,就可以理解为什么共轭族很好,例如卡尔曼滤波器。当您编写具有离散状态空间的隐藏式马尔可夫模型时,您会明白为什么不必计算任何可能性,并且过滤/平滑很容易。(我认为我在这里偏离了常规的hmm行话。)

2)在编写大量代码时会费劲,这会让您意识到状态空间模型的定义有多普遍。很快,您将写下您要使用的模型,同时了解为什么不能这样做。首先,您最终会发现您无法以惯用的两种形式之一将其写下来。再考虑一下时,您写下贝叶斯规则,发现问题在于您无法计算出某种可能性的数据。

因此,您最终将无法计算这些后验分布(平滑或过滤状态的分布)。为了解决这个问题,这里有很多近似过滤的东西。粒子过滤只是其中之一。粒子过滤的主要优点:您可以根据这些分布进行模拟,因为无法计算它们。

您如何模拟?大多数算法只是重要性采样的某种变体。但是它在这里的确也变得更加复杂。我建议使用Doucet和Johansen的教程纸(http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf)。如果您了解闭式表单过滤的工作原理,他们将介绍重要性抽样的一般概念,然后介绍蒙特卡洛方法的一般概念,然后通过一个不错的财务时间序列示例向您展示如何使用这两件事。恕我直言,这是我遇到的关于粒子过滤的最佳教程。

除了在组合中添加两个新概念(重要性采样和蒙特卡洛方法)外,现在还有更多符号。从现在开始采样的一些密度;您正在评估的一些样本,当您评估它们时,您是在样本评估。全部编码后,结果就是加权样本,被视为粒子。每次进行新观察后,它们都会更改。立即将所有这些都收集起来非常困难。我认为这是一个过程。

如果我是神秘人物或手形人物,我深表歉意。这只是我个人对该主题熟悉的时间表。Matthew Gunn的帖子可能更直接地回答了您的问题。我只是觉得我会抛弃这个回应。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.