贝叶斯在线变更点检测(边际预测分布)


9

我正在阅读Adams和MacKay 的贝叶斯在线变更点检测论文(链接)。

作者从写边际预测分布开始: 其中

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
  • xt是在时间的观测;t
  • x1:t表示直到时间的观测;t
  • rtN是当前游程长度(自上一个更改点以来的时间,可以为0);和
  • xt(r)是与运行相关的观察值集合。rt

等式 1在形式上是正确的(请参阅下面@JuhoKokkala的回复),但是我的理解是,如果您想对进行实际预测,则需要将其扩展如下:xt+1

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

我的理由是,(未来)时间t + 1可能会有一个变化点t+1,但后验P(rt|x1:t)仅覆盖到t为止t

关键是,论文的作者使我们有了等式。1 照原样(请参见本文中的方程3和11),而不是 1b。因此,当从时间t的可用数据预测x_ {t + 1}时,他们似乎忽略了时间t+1发生变化点的可能性。在第2节开始时,他们说顺便xt+1t

我们假设可以在给定游程长度r_t的条件下计算[ xt+1 ] 的预测分布。rt

这也许就是诀窍所​​在。但总的来说,这种预测分布应类似于方程式。1b; 这不是他们所做的(方程11)。

因此,我不确定我了解发生了什么。该符号可能正在发生一些有趣的事情。


参考

  • Adams,RP和MacKay,DJ(2007)。贝叶斯在线变更点检测。arXiv预印本 arXiv:0710.3742。

一个可能的解释是,表示时间步结束时的行程长度,该步长在时间处的变化点之后。有了这个,1有意义。实际上,该算法的一种初始化是通过设置,假设就是在处开始之前存在一个更改点。但是,图1是错误的(或至少具有误导性),因为如果在和之间以及在和之间存在如图1a所示的变化点,则和rtttP(r0=0)=1t=1t=4t=5t=10t=11r4r10根据此符号,该值应为0,而不是如图1b所示的和。r5r11
–lacerbi

1
等式中发生了一些奇怪的事情。3作为最后一行中求和的中间因素是 而我认为包含。我怀疑和切换了位置,因为会有意义。在等式中 在图11中,右侧似乎完全取决于,而根本没有出现在左侧,因此要么有问题,要么我根本不理解该符号。P(xtrt1,xt(r))xt(r)xttt1P(xtrt,xt1(r))xt(r)
Juho Kokkala

@ JuhoKokkala:我很高兴我不是唯一拥有这种感觉的人……
–lacerbi

1
@lacerbi,我对本文还有另一个问题,因为您似乎对工作熟悉,所以您也许可以回答它:stats.stackexchange.com/questions/419988
gwg

Answers:


5

(1)和(1b)都是正确的。OP正确地认为(在此模型中)处可能有一个更改点,而取决于是否存在更改点。这并不意味着(1)会出现任何问题,因为的可能值已由完全“覆盖” 。表示的条件分布的条件上。此条件分布在包括条件的包括“ ”在内的“其他所有东西”上平均。就像可以写出t+1xt+1rt+1P(xt+1rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1(rt,x1:t)P(xt+1000|xt),这将考虑到所有可能的变更点配置以及和之间出现的 s 值。xitt+1000

在其余部分中,我首先基于(1)得出(1),然后得出(1b)。

(1)的派生

对于任何随机变量,我们有 ,只要是离散的(否则,总和需要用整数代替)。将其应用于:A,B,C

P(AB)=cP(AB,C=c)P(C=cB),
Cxt+1,x1:t,rt

P(xt+1x1:t)=rtP(xt+1rt,x1:t)P(rtx1:t),
不管,,之间的依赖关系如何,即没有模型假设被使用。在本模型中,假定给定有条件地独立于之前的行程的值。这意味着。将其代入前面的方程,我们得到rtx1:txt+1xt+1rt,xt(r)xxt(r)P(xt+1rt,x1:t)=P(xt+1rt,xt(r))

P(xt+1x1:t)=rtP(xt+1rt,xt(r))P(rtx1:t),(1)
在OP中为(1)。

(1b)的派生

让我们考虑在可能值上分解: P(xt+1rt,xt(r))rt+1

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,rt,xt(r))P(rt+1rt,xt(r)).

由于假设*某个变化点是否出现在(在和)不取决于的历史记录,因此我们有。此外,由于确定是否与属于同一,因此我们有。将这两个简化代入上述分解中,我们得到 t+1xtxt+1xP(rt+1rt,xt(r))=P(rt+1rt)rt+1xt+1xtP(xt+1rt+1,rt,xt(r))=P(xt+1rt+1,xt(r))

P(xt+1rt,xt(r))=rt+1P(xt+1rt+1,xt(r))P(rt+1rt).
将其代入(1),我们得到 ,即OP的(1b)。
P(xt+1x1:t)=rt(rt+1P(xt+1rt+1,xt(r))P(rt+1rt))P(rtx1:t),(1b)

*备注模型的条件独立性假设

基于快速浏览本文,我个人希望在某个地方更明确地说明条件独立性,但我想这样做的目的是是马尔可夫式的,与不同运行关联的:s是独立的(给定运行)。rx


1
(+1)谢谢。是的,我当然知道。如果假设隐式边缘化,则1在形式上是正确的。问题在于作者后来做出了预测(本文中的方程11,而隐含在方程3中),并且当他们采用它们时,它们似乎并未超出边缘。rt+1rt+1
–lacerbi

1
哦。看来我误解了这个问题-我应该删除这个问题吗?您可能需要澄清这个问题,目前看来(1)有点不正确(而不是可能没有用)
Juho Kokkala

请保留此答案,这很有价值。我在原始帖子中不够清楚的错误。感谢您的评论,我试图澄清我的问题,并且仍然使该答案有意义。
–lacerbi
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.