如何统计比较两个时间序列?


43

我有两个时间序列,如下图所示:

时间序列图

该图显示了两个时间序列的全部细节,但是如果需要,我可以轻松地将其简化为巧合的观测值。

我的问题是:我可以使用哪些统计方法来评估时间序列之间的差异?

我知道这是一个相当广泛且模糊的问题,但我似乎在任何地方都找不到很多介绍性材料。正如我所看到的,需要评估两个不同的方面:

1.值是否相同?

2.趋势是否相同?

您会建议使用哪种统计测试来评估这些问题?对于问题1,我显然可以评估不同数据集的均值并寻找分布的显着差异,但是有没有一种方法可以考虑到数据的时间序列性质呢?

对于问题2-是否有类似Mann-Kendall检验的东西来寻找两个趋势之间的相似性?我可以对两个数据集进行Mann-Kendall检验并进行比较,但是我不知道这是否是一种有效的处理方法,或者是否有更好的方法?

我正在R中进行所有这些操作,因此,如果您建议测试使用R包,请告诉我。


9
该图似乎掩盖了这些系列之间的关键差异:它们可能以不同的频率采样。黑线(Aeronet)似乎仅被采样了大约20次,红线(可见性)被采样了数百次或更多次。另一个关键因素可能是采样的规律性或采样的规律性:Aeronet观测之间的时间似乎有所不同。通常,它有助于消除连接线并仅显示与实际数据相对应的点,以便观看者可以直观地确定这些内容。
ub

是用于间隔时间序列分析的Python库。
kjetil b halvorsen

Answers:


27

正如其他人所述,您需要有一个通用的测量频率(即两次观察之间的时间)。有了这个,我将确定一个可以合理地分别描述每个系列的通用模型。这可能是ARIMA模型,也可能是具有可能的水平偏移的多趋势回归模型,或者是同时集成了内存(ARIMA)和虚拟变量的复合模型。可以针对两个系列中的每个系列分别全局估计该通用模型,然后可以构造F检验来检验一组通用参数的假设。


1
好吧,您实际上并不需要两个系列的频率相同。只是这样,其他情况下几乎没有软件,但请参见traces.readthedocs.io/en/latest。天文学期刊以及金融和地球物理学方面的其他案例似乎已被公开发表……请参见en.wikipedia.org/wiki/Unevenly_spaced_time_series中的
kjetil b halvorsen

12

考虑grangertest()lmtest库。

这是一项测试,看一个时间序列对预测另一个时间序列是否有用。

一些参考资料可以帮助您入门:

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/

https://spia.uga.edu/faculty_pages/monogan/teaching/ts/Kgranger.pdf

http://en.wikipedia.org/wiki/Granger_causality


1
在少于10个数据点的情况下,与需要在Granger中容纳的参数数量相比,他的样本量太小。
亚瑟(Jase)2012年

1
@fionn,您答案中的链接已消失。你能更新你的答案吗?
Davor Josipovic

0

刚遇到这个。您的第一个答案是绘制两套相同比例的g(在时间上)以直观地看到差异。您已完成此操作,可以轻松看到其中一些明显的差异。下一步是使用简单的相关分析...并使用相关系数(r)观察它们之间的相关程度。如果r小,则您的结论将是它们之间的相关性较弱,因此没有可取的比较;如果r表示两个系列之间的比较好,则得出较大的值。具有良好相关性的第三步是检验r的统计显着性。在这里,您可以使用Shapiro Welch检验,该检验将假定两个序列是正态分布的(零假设)或非正态分布的(替代假设)。您可以进行其他测试,但我希望我的回答对您有所帮助。


1
比较时间序列时,它是自相关的并且可能拟合时间序列模型。例如ARIMA模型,可以帮助确定它们的相似程度。绘制它们时,同一随机过程的两种实现不一定看起来相同。
Michael Chernick

-2

使用polyfit将一条直线拟合到两个时间序列信号。然后计算两条线的均方根误差(RMSE)。红线获得的值将比灰线获得的值小得多。

还要以一些常见的频率读数。


2
欢迎使用Cross Validated,并感谢您的首次回答!但是,我担心您没有直接回答问题-提议的方法将如何精确地帮助询问者评估值和/或趋势是否相似?
马丁·莫德拉克(MartinModrák)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.