Questions tagged «change-point»

尝试检测分发​​,流程或功能何时发生更改的方法。

6
通过分段线性函数查找数据中的变化点
问候, 我正在进行研究,这将有助于确定观察到的空间的大小以及自从发生大爆炸以来经过的时间。希望您能提供帮助! 我有符合分段线性函数的数据,我要在该函数上执行两个线性回归。斜率和截距在某个点发生变化,我需要(编写一个程序)找到该点。 有什么想法吗?

1
如何突出显示时间序列中的嘈杂补丁?
我有很多时间序列数据-水位和速度与时间的关系。它是水力模型仿真的输出。作为检查过程的一部分,以确认模型是否按预期运行,我必须绘制每个时间序列图,以确保数据中没有“摆动”(请参见下面的示例轻微摆动)。使用建模软件的UI是一种非常缓慢且费力的检查数据的方法。因此,我编写了一个简短的VBA宏,以将模型中的各种数据(包括结果)导入Excel并一次将其全部绘制出来。我希望编写另一个简短的VBA宏来分析时间序列数据并突出显示任何可疑的部分。 到目前为止,我唯一的想法就是可以对数据的斜率进行一些分析。在给定的搜索窗口内,斜率多次从正变为负的快速变化的任何地方都可以归类为不稳定。我是否缺少任何更简单的技巧?本质上,“稳定”模拟应提供非常平滑的曲线。任何突然的变化都可能是计算不稳定的结果。

1
贝叶斯在线变更点检测(边际预测分布)
我正在阅读Adams和MacKay 的贝叶斯在线变更点检测论文(链接)。 作者从写边际预测分布开始: 其中P(xt+1|x1:t)=∑rtP(xt+1|rt,x(r)t)P(rt|x1:t)(1)P(xt+1|x1:t)=∑rtP(xt+1|rt,xt(r))P(rt|x1:t)(1) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t} P(x_{t+1} | r_t, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) \qquad \qquad (1) xtxtx_t是在时间的观测;ttt x1:tx1:t\textbf{x}_{1:t}表示直到时间的观测;ttt rt∈Nrt∈Nr_t \in \mathbb{N}是当前游程长度(自上一个更改点以来的时间,可以为0);和 x(r)txt(r)\textbf{x}_t^{(r)}是与运行相关的观察值集合。rtrtr_t 等式 1在形式上是正确的(请参阅下面@JuhoKokkala的回复),但是我的理解是,如果您想对进行实际预测,则需要将其扩展如下:xt+1xt+1x_{t+1} P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,x(r)t)P(rt|x1:t)P(rt+1|rt)(1b)P(xt+1|x1:t)=∑rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t, r_{t+1}} P(x_{t+1} | r_{t+1}, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) P(r_{t+1} | r_t) \qquad (1\text{b}) 我的理由是,(未来)时间t + 1可能会有一个变化点t+1t+1t+1,但后验P(rt|x1:t)P(rt|x1:t)P(r_t | …

2
通过概率编程(pymc)进行开关点检测
我目前正在阅读《概率编程和贝叶斯黑客方法》一书。我已经阅读了几章,并且在第一章中进行思考,其中pymc的第一个示例包括检测文本消息中的巫婆点。在该示例中,用于指示切换点何时发生的随机变量用ττ\tau。MCMC步骤后, ττ\tau 给出: 首先,从该图可以了解到,在第45天发生转换点的可能性接近50%。如果没有转换点,该怎么办?我想确定是否确实存在一个切换点,而不是假设有一个切换点然后尝试找到它。 作者通过“没有发生变化,或者随着时间的推移变化是逐渐变化的,……的后验分布”来回答“是否发生了切换点”问题。 ττ\tau 本来可以散布的。”但是您如何以可预测性来回答这个问题,例如,发生切换点的机率是90%,而在第45天发生机率的机率是50%。 是否需要更改型号?还是可以用当前模型来回答?

2
最先进的方法来查找时间序列的零均值部分
我有嘈杂的时间序列,我需要将其细分为平均值为零的那些部分和平均值为零的那些部分。尽可能准确地找到边界很重要(显然边界的确切位置有点主观)。我认为可以修改cusum变体来实现此目的,但是因为cusum主要是要找到单个更改,从而使整个细分策略完全无法解决。 我敢肯定,已经对此问题进行了很多研究,但未能找到它。 PS这些时间序列中的数据量非常大,即多达数亿个样本,单个样本可以是具有数百个分量的向量,因此可以合理快速计算的方法是一个重要因素。 PPS没有细分标签,因此没有分类标签。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.