是否有用于模拟不规则间隔时间序列的金标准?


45

在经济学领域(我认为),我们有ARIMA和GARCH用于规则间隔时间序列,而Poisson,Hawkes用于建模点过程,那么尝试对不规则(不均匀)间隔时间序列进行建模的尝试-是否存在(至少)任何常见实践?

(如果您对该主题有一定的了解,还可以展开相应的Wiki文章。)

版本(关于缺失值和不规则间隔的时间序列):

回答@Lucas Reis评论。如果测量或实现变量之间的间隙由于(例如)泊松过程而间隔开,则这种正则化的空间就不大了,但它存在一个简单的过程:t(i)是变量x的第i个时间索引(x的第i个时间)实现x),则限定间隙的测量值作为时间之间g(i)=t(i)-t(i-1),那么我们就离散g(i)使用常数cdg(i)=floor(g(i)/c并与原来的时间序列的老观测之间的空白值的数量创建新的时间序列ii+1等于DG(我),但问题是,这该过程很容易产生时间序列,而缺失数据的数量远大于观测值的数量,因此,对缺失观测值的合理估计可能是不可能的,而且可能太大c删除“时间结构/时间依赖性等”。分析的问题(极端情况是通过将c>=max(floor(g(i)/c))简单地将不规则间隔的时间序列分解为规则间隔而给出的

Edition2(只是为了好玩):图像说明了在不规则间隔的时间序列甚至点过程中缺失的值。


为了澄清一下,当您说“不规则间距”时,您的意思不是“等距间距但缺少值”,对吗?
韦恩

2
否:) t(i)-时间,x[t(i)],x[t(i+1)],x[t(i+2)]...并且t(j+1)-t(j)不是恒定的。数据以分布式或异步方式收集。
Qbik


2
插值并使用规则间隔的插值进行分析怎么样?有人知道这种方法的含义吗?
卢卡斯·里斯

首先模拟点的时间,然后根据点的时间来模拟点的值,该怎么办?我相信“标记点过程”是术语。
PeterR 2012年

Answers:


26

如果随机过程的观测值不规则地间隔开,则对观测值进行建模的最自然的方法就是来自连续时间过程的离散时间观测值。

模型规范通常需要的是在时间t 1 < t 2 < < t n时观测到的观测值的联合分布,例如,可以将其分解为条件分布。X i给定X i 1X 1。如果过程是马尔可夫过程,则此条件分布取决于X i 1而不取决于X iX1,,Xnt1<t2<<tnXiXi1,,X1Xi1 -取决于 t i t i 1。如果过程是时间均匀的,则仅通过时间差 t i t i 1对时间点的依赖。X一世-2X1个 -Ť一世Ť一世-1个Ť一世-Ť一世-1个

从中我们可以看到,如果我们从时间均匀的马尔可夫过程中得到等距的观测值(例如,),我们只需要指定一个条件概率分布P 1即可指定模型。否则,我们需要指定一个条件概率分布的整个集合P t it i 1,该分布由观测的时间差来索引,以指定模型。实际上,后者最容易通过指定连续时间条件概率分布的族P t来完成。Ť一世-Ť一世-1个=1个P1个PŤ一世-Ť一世-1个PŤ

获得连续时间模型规格的常用方法是通过随机微分方程(SDE) 开始对SDE模型进行统计的一个好地方是随机微分方程的仿真和推断

dXŤ=一种XŤdŤ+bXŤdŤ
由Stefano Iacus撰写。可能为等距观察描述了许多方法和结果,但这通常只是为了方便演示,对于应用程序不是必需的。一个主要障碍是,当您进行离散观测时,SDE规范很少考虑到显式可能性,但是存在完善的估算方程替代方案。

dXŤ=0Ť一种sXŤ-Xsds+σdŤ
p

我认为可以说,在不规则时间点处理观测数据时,通常的做法是建立一个连续的时间随机模型。


1
GARCH不是随机波动过程。GARCH的体积完全由先前时期的观测值确定。
Aksakal

11

对于不规则的时间序列,构造一个卡尔曼滤波器很容易。

存在纸张如何ARIMA转移到状态空间形式在这里

还有一纸比较卡尔曼以GARCH 这里1 1个

1个


抱歉,我无法获取最后一篇论文,您能否请我帮忙?
石英

2
我添加了引文,因此很容易找到-这里还有预印本:eprints.soton.ac.uk/147383
bdecaf 2013年

关于将ARIMA转移到状态空间的论文似乎有一个断断续续的链接。
ofey73 '18

9

当我在寻找一种方法来测量波动的不规则采样数据I由CIPRA [横跨这两篇论文来对不规则数据指数平滑量12 ]。这些进一步建立在Brown,Winters和Holt的平滑技术(请参阅Wikipedia-entry 指数平滑)上,以及Wright的另一种方法(请参阅论文作为参考)。这些方法对基本过程的假设不多,并且也适用于显示季节性波动的数据。

我不知道它是否算作“黄金标准”。出于我自己的目的,我决定遵循Brown方法使用两种方式(单次)的指数平滑。我想到了两种方法来简化将摘要阅读到学生论文的想法(现在找不到)。


7

由于没有太多可用的工具,因此对不规则采样的时间序列进行分析可能很棘手。有时,实践是应用常规算法并希望达到最佳效果。这不一定是最好的方法。其他时候,人们尝试在差距中插入数据。我什至看到过用随机数填充空白的情况,这些随机数的分布与已知数据相同。一种专门针对不规则采样序列的算法是Lomb-Scargle周期图,它为不均匀采样的时间序列提供了一个周期图(认为功率谱)。Lomb-Scargle不需要任何“间隙调节”。


3

如果要使用“局部”时域模型(而不是估计相关函数或功率谱),例如为了检测和表征瞬态脉冲,跳跃等,那么贝叶斯块算法可能会很有用。它提供了在任何数据模式下以及任意(不均匀)间隔采样的时间序列的最佳分段常数表示。看到

“天文学时间序列分析研究。VI。贝叶斯块表示法”,Scargle,Jeffrey D .;诺里斯,杰伊·P。杰克逊,布拉德;Chiang,James,天体物理学杂志,第764卷,167,26页(2013)。http://arxiv.org/abs/1207.5578


2

RJMartin,“不规则采样的信号:分析的理论和技术”,UCL博士论文,1998年,在线提供。正如其他帖子所说,第4章讨论自回归模型并从连续时间的角度发展主题。


1

J.Durbin,SJKoopman的第4.10节“ 通过状态空间方法进行时间序列分析”(第二版,2012年)专门用于在缺少观测值的情况下进行建模。


1

在空间数据分析中,数据大部分时间是在空间中不规则采样的。因此,一个想法是查看在那里进行的操作,并对一维“时域”实施方差图估计,克里金法等。即使对于规则间隔的时间序列数据,方差图也可能会很有趣,因为它具有与自相关函数不同的属性,并且即使对于非平稳数据,其定义也很有意义。

这是一篇论文(西班牙语),这里是另一篇。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.