最先进的方法来查找时间序列的零均值部分


9

我有嘈杂的时间序列,我需要将其细分为平均值为零的那些部分和平均值为零的那些部分。尽可能准确地找到边界很重要(显然边界的确切位置有点主观)。我认为可以修改cusum变体来实现此目的,但是因为cusum主要是要找到单个更改,从而使整个细分策略完全无法解决。

我敢肯定,已经对此问题进行了很多研究,但未能找到它。

PS这些时间序列中的数据量非常大,即多达数亿个样本,单个样本可以是具有数百个分量的向量,因此可以合理快速计算的方法是一个重要因素。

PPS没有细分标签,因此没有分类标签。

Answers:



1

这可能不是最新技术,但是一种直观的方法是通过将权重放在靠近每个时间点的观测值上来平滑数据。因此,如果您想知道样本R在时间T是否具有零均值:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

根据边界的定义,指数权重可能是一个不错的选择。

在处理了一些技术细节(例如每个采样的开始和结尾处的定义)之后,您现在可以简单地测试每个mu是否足够接近零以找到均值为零的点。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.