为什么时间序列必须是固定的?


92

我知道平稳的时间序列是一个平均值和方差随时间变化的序列。有人可以解释一下为什么必须在运行不同的ARIMA或ARM模型之前确保数据集固定吗?这是否也适用于自相关和/或时间不是因素的正态回归模型?


2
什么是ARM模型?你是说ARMA吗?
mpiktas 2011年

9
平稳性不仅需要恒定的均值和方差。平稳性弱要求协方差函数不依赖于。cov(Xt,Xt+h)t
mpiktas 2011年

11
您不需要平稳运行AR MA模型,因为如果阶数,则它显然是非平稳的。平稳性是ARMA的假设。II()>0
2013年

1
尽管严格地说,订单注释为+1,但前提是的订单位于。对于任意订单,有ARFIMAI{0,1,2,...}
共轭

@Glen_b ARIMA模型可以用于任何非平稳序列吗?还是有一些特定的非固定性案例适用ARIMA cana?
Nizar

Answers:


75

平稳性是依赖结构的一种类型。

假设我们有一个数据。最基本的假设是是独立的,即我们有一个样本。独立性是一个很好的属性,因为使用它我们可以得出很多有用的结果。问题是有时(或经常取决于视图)此属性不成立。X1,...,XnXi

现在,独立性是一个独特的属性,两个随机变量只能以一种方式独立,但是它们可以以多种方式依赖。因此平稳性是对依赖结构进行建模的一种方法。事实证明,对于独立随机变量(大数定律,中心极限定理仅举几例)成立的很多不错的结果对于平稳随机变量(我们应该严格地说是序列)成立。当然,事实证明,很多数据可以被认为是固定的,因此平稳性的概念在对非独立数据建模时非常重要。

当我们确定我们具有平稳性时,自然就可以对其建模。这就是ARMA模型出现的地方。事实证明,借助Wold分解定理,任何静态数据都可以用静态ARMA模型来近似。因此,这就是ARMA模型非常受欢迎的原因,这就是为什么我们需要确保该系列是固定的才能使用这些模型。

现在,同样的故事和关于独立和依赖的故事一样。平稳性是唯一定义的,即数据是固定的还是不固定的,因此只有固定数据的方法,而有许多方法是固定的。再次证明,经过某些转换后,许多数据变得固定不变。ARIMA模型是非平稳性的一种模型。假定在差分之后数据变得稳定。

在回归上下文中,平稳性很重要,因为如果数据是固定的,则适用于独立数据的结果相同。


4
我建议您将响应的这一部分放在其中(“这是ARMA模型的用处。事实证明,借助Wold分解定理,任何静态数据都可以用静态ARMA模型来近似。因此,ARMA模型非常适合流行,这就是为什么我们需要确保该系列固定不变才能使用这些模型。”)以粗体显示,因为这主要是在回答问题。
诗人莫迪

34

在时间序列上进行统计分析时,通常需要多少数量?我们想知道

  • 它的期望值
  • 它的方差,以及
  • 一组值之间的值周期之间的相关性。ss

我们如何计算这些东西?在多个时间段内使用均值。

如果多个时间段的期望值相同,则多个时间段的平均值才有意义。如果这些总体参数可以变化,那么通过对整个时间取平均值可以真正估算出什么?

(弱)平稳性要求这些人口数量在时间上必须相同,从而使样本平均值成为估计它们的合理方法。

除此之外,平稳过程避免了虚假回归的问题。


12

统计学习的基本思想是您可以通过重复实验来学习。例如,我们可以继续翻转图钉以了解图钉落在头上的可能性。

在时间序列上下文中,我们观察到随机过程的一次运行,而不是随机过程的重复运行。我们观察到1个长期实验,而不是多个独立实验。

我们需要平稳性和遍历性,以便观察随机过程的长期运行类似于观察随机过程的许多独立运行。

一些(不精确的)定义

令为样本空间。随机过程是时间和结果的函数。Ω{Yt}t{1,2,3,}ωΩ

  • 对于任何时间,都是一个随机变量(即从到某个空间(例如实数空间)的函数)。tYtΩ
  • 对于任何结果我们都有是确定性级数ωX(ω){Y1(ω),Y2(ω),Y3(ω),}

时间序列中的一个基本问题

在Statistics 101中,我们学习了一系列独立且分布均匀的变量,,等。我们观察到多个相同的实验,其中是随机的选择这使我们能够了解随机变量。根据大数定律,我们有几乎可以肯定地收敛到。X1X2X3i=1,,nωiΩX1ni=1nXiE[X]

时间序列设置中的一个根本区别是,我们在时间观察到多个观测值,而不是从多个结果。tΩ

在一般情况下,可能根本不会收敛!1Tt=1TYt

为了随着时间的推移进行多次观测,以完成与样本空间多次绘制相似的任务,我们需要平稳遍历

如果存在无条件均值并且满足遍历定理的条件,则时间序列样本均值将收敛到无条件均值。E[Y]1Tt=1TYtE[Y]

示例1:平稳性失败

令为退化过程。我们可以看到不是平稳的(联合分布不是随时间变化的)。{Yt}Yt=t{Yt}

令为时间序列样本均值,很明显不会收敛为:。的均值不存在,并且不会收敛为。St=1ti=1tYiSttS1=1,S2=32,S3=2,,St=t+12YtStt

示例:遍历失败

令为一次硬币翻转的结果。令表示所有,即或。XYt=Xt{Yt}=(0,0,0,0,0,0,0,){Yt}=(1,1,1,1,1,1,1,

即使,时间序列样本均值不会给出你的意思是。E[Yt]=12St=1ti=1tYiYt


10

要在其他一些不错但更详细的答案中添加高级答案,平稳性很重要,因为在没有该平稳性的情况下,描述数据的模型在不同时间点的准确性会有所不同。这样,样本统计(例如均值,方差和相关性)需要平稳,才能在所有感兴趣的时间点准确描述数据。

查看下面的时间序列图,您可以(希望)看到任何给定时间段的均值和方差如何才能很好地代表整个固定时间序列,而相对差的代表整个非平稳时间序列。例如,非平稳时间序列的均值远低于并且其方差在此范围内比在范围内高得多。600<t<800200<t<400

在此处输入图片说明


8

首先,ARIMA(p,1,q)过程不是平稳的。这些就是所谓的积分序列,例如是ARIMA(0,1,0)或I(1)过程,也是随机游动或单位根。因此,不,您不需要全部固定。xt=xt1+et

但是,我们经常会寻找平稳性。为什么?

考虑预测问题。您如何预测?如果明天一切都不同,那么就无法预测,因为一切都会不同。所以关键要预测是找到的东西,这将是相同的明天,并延长明天。那东西可以是任何东西。我给你举几个例子。

在上面的I(1)模型中,我们经常假设(或希望)今天和明天的错误分布相同:。因此,在这种情况下,我们要说明天的分布仍将是正态的,并且其均值和方差仍将是0和。这还没有使序列平稳,但是我们发现了过程中的不变部分。接下来,如果您看一下第一个差异:这只猫是静止的。但是,请理解,目标并不是真正找到平稳序列etN(0,σ2)σ2Δxtxtxt1=etΔxt,但要找到不变的东西,那就是错误的分布。发生这种情况的原因是,按照定义,在平稳序列中将存在不变的部分,例如无条件均值和方差。

另一个例子,说真实的序列是:。说,我们对错误的唯一了解是它们的均值为零:。现在,我们可以再次预测!我们所需要做的就是估算增长率,这就是不变的和误差的平均值。每次发现不变的事物时,您都可以进行预测。xt=αt+etE[et]=0α

为了进行预测,我们绝对需要在序列中找到常数(时间不变)分量,否则就无法通过定义进行预测。平稳性只是不变性的一个特殊情况。


5

由于ARIMA大多数情况下都在自我回归,因此它使用了一种自我诱导的多元回归,这种回归可能不受趋势或季节性的强烈影响。这种多元回归技术基于以前的时间序列值,尤其是最近时期内的那些序列值,并且使我们能够提取多个过去的值之间的非常有趣的“相互关系”,这些过去的值可用来解释未来的值。


2

时间序列是关于分析序列值依赖于先前值的方式。正如SRKX所建议的那样,可以对一个非平稳序列进行差异化或趋势化或均值化,但这不是不必要的!)来创建一个平稳序列。ARMA分析需要平稳性。如果对于每个和的分布与的分布相同,则是严格平稳的X(Xt+1,,Xt+k)(X1,,Xk)tk。来自Wiki:平稳过程(或严格(完全)平稳过程或强(完全)平稳过程)是随机过程,其联合概率分布在时间或空间上变化时不会改变。因此,诸如均值和方差之类的参数(如果存在)也不会随时间或位置变化。另外,正如Cardinal正确指出的那样,自相关函数必须随时间不变(这意味着协方差函数随时间恒定),并转换为ARMA模型的参数在所有时间间隔内都是不变/恒定的。

ARMA模型的平稳性思想与可逆性思想紧密相关。

考虑形式为。该模型具有爆炸性,因为多项式根在单位圆内,因此违反了要求。在单位圆内具有根的模型意味着“较旧的数据”比“较新的数据”更重要,这当然是没有意义的。y(t)=1.1y(t1)(11.1B)


1
有点疑问:当您说“ 如果前两个时刻随时间不变时,是二阶平稳的”,您的意思还不清楚。通常,当我想到二阶平稳性时,除了均值的不变性外,我还认为自相关函数随时间变化是不变的。当然,这比您所陈述的(天真?)解释的条件(强得多)。X
主教

在您最近的编辑中似乎没有提到二阶平稳。那是故意的吗?(我的原始评论比严格的平稳性更着重于二阶平稳性。)
主教

:cardinal我想我觉得您的评论很重要,并且可以使您更清楚地了解所假定的内容。如果您认为“二阶平稳”的思想更加清晰,请帮助我以一种简单易懂的英语来阐明我的观点。
IrishStat

-2

ARMA和ARIMA的建立是假设序列是固定的。如果序列不是,那么预测将是不正确的。

仅当序列平稳时,样本统计数据(均值,方差,协方差)才可用作将来行为的描述符。例如,如果序列随时间持续增加,则样本均值和方差将随样本的大小而增加,并且它们始终会低估未来期间的均值和方差。在外推拟合非平稳数据的回归模型时,请务必谨慎。


-3

在我看来,随机过程是由三个必须随时间变化的统计属性控制的过程。它们是均值方差和自相关函数。尽管前两个并不能说明过程随时间的变化,所以应该考虑第三种特性,即自相关函数,该特性告诉人们依赖性随时间的流逝如何衰减(滞后)。


5
这使它成为一个随机过程并且保持平稳是很混乱的,因此从一个基本错误开始。您的答案对已发布的内容有何帮助?
尼克·考克斯

-3

为了解决任何问题,我们需要使用静力学在数学上对方程建模。

  1. 为了解决这些方程,它必须是独立的和平稳的(不动)
  2. 只有在固定数据中,我们才能获得洞察力并进行多用途的数学运算(均值,方差等)。
  3. 在非平稳状态下,很难获取数据

在转换过程中,我们将获得趋势和季节性


2
您的答案都没有道理。问题的前提是错误的。从理论上和观察上,许多时间序列都可以认为是不稳定的。例如,也有许多方法可以解决这个问题!2.系列,包括正弦波之类的周期性分量。
迈克尔·切尔尼克

@MichaelChernick在微分和季节性微分中,我们将非平稳序列转换为平稳序列。我接受您的观点,即许多时间序列不是平稳的,但是要在数学上求解它,我们需要将其转换为平稳的一个权重
saravanan saminathan
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.