我知道平稳的时间序列是一个平均值和方差随时间变化的序列。有人可以解释一下为什么必须在运行不同的ARIMA或ARM模型之前确保数据集固定吗?这是否也适用于自相关和/或时间不是因素的正态回归模型?
我知道平稳的时间序列是一个平均值和方差随时间变化的序列。有人可以解释一下为什么必须在运行不同的ARIMA或ARM模型之前确保数据集固定吗?这是否也适用于自相关和/或时间不是因素的正态回归模型?
Answers:
平稳性是依赖结构的一种类型。
假设我们有一个数据。最基本的假设是是独立的,即我们有一个样本。独立性是一个很好的属性,因为使用它我们可以得出很多有用的结果。问题是有时(或经常取决于视图)此属性不成立。
现在,独立性是一个独特的属性,两个随机变量只能以一种方式独立,但是它们可以以多种方式依赖。因此平稳性是对依赖结构进行建模的一种方法。事实证明,对于独立随机变量(大数定律,中心极限定理仅举几例)成立的很多不错的结果对于平稳随机变量(我们应该严格地说是序列)成立。当然,事实证明,很多数据可以被认为是固定的,因此平稳性的概念在对非独立数据建模时非常重要。
当我们确定我们具有平稳性时,自然就可以对其建模。这就是ARMA模型出现的地方。事实证明,借助Wold分解定理,任何静态数据都可以用静态ARMA模型来近似。因此,这就是ARMA模型非常受欢迎的原因,这就是为什么我们需要确保该系列是固定的才能使用这些模型。
现在,同样的故事和关于独立和依赖的故事一样。平稳性是唯一定义的,即数据是固定的还是不固定的,因此只有固定数据的方法,而有许多方法是固定的。再次证明,经过某些转换后,许多数据变得固定不变。ARIMA模型是非平稳性的一种模型。假定在差分之后数据变得稳定。
在回归上下文中,平稳性很重要,因为如果数据是固定的,则适用于独立数据的结果相同。
统计学习的基本思想是您可以通过重复实验来学习。例如,我们可以继续翻转图钉以了解图钉落在头上的可能性。
在时间序列上下文中,我们观察到随机过程的一次运行,而不是随机过程的重复运行。我们观察到1个长期实验,而不是多个独立实验。
我们需要平稳性和遍历性,以便观察随机过程的长期运行类似于观察随机过程的许多独立运行。
令为样本空间。随机过程是时间和结果的函数。
在Statistics 101中,我们学习了一系列独立且分布均匀的变量,,等。我们观察到多个相同的实验,其中是随机的选择这使我们能够了解随机变量。根据大数定律,我们有几乎可以肯定地收敛到。
时间序列设置中的一个根本区别是,我们在时间观察到多个观测值,而不是从多个结果。
在一般情况下,可能根本不会收敛!
为了随着时间的推移进行多次观测,以完成与样本空间多次绘制相似的任务,我们需要平稳和遍历。
如果存在无条件均值并且满足遍历定理的条件,则时间序列样本均值将收敛到无条件均值。
令为退化过程。我们可以看到不是平稳的(联合分布不是随时间变化的)。
令为时间序列样本均值,很明显不会收敛为:。的均值不存在,并且不会收敛为。
令为一次硬币翻转的结果。令表示所有,即或。
即使,时间序列样本均值不会给出你的意思是。
首先,ARIMA(p,1,q)过程不是平稳的。这些就是所谓的积分序列,例如是ARIMA(0,1,0)或I(1)过程,也是随机游动或单位根。因此,不,您不需要全部固定。
但是,我们经常会寻找平稳性。为什么?
考虑预测问题。您如何预测?如果明天一切都不同,那么就无法预测,因为一切都会不同。所以关键要预测是找到的东西,这将是相同的明天,并延长该明天。那东西可以是任何东西。我给你举几个例子。
在上面的I(1)模型中,我们经常假设(或希望)今天和明天的错误分布相同:。因此,在这种情况下,我们要说明天的分布仍将是正态的,并且其均值和方差仍将是0和。这还没有使序列平稳,但是我们发现了过程中的不变部分。接下来,如果您看一下第一个差异:这只猫是静止的。但是,请理解,目标并不是真正找到平稳序列,但要找到不变的东西,那就是错误的分布。发生这种情况的原因是,按照定义,在平稳序列中将存在不变的部分,例如无条件均值和方差。
另一个例子,说真实的序列是:。说,我们对错误的唯一了解是它们的均值为零:。现在,我们可以再次预测!我们所需要做的就是估算增长率,这就是不变的和误差的平均值。每次发现不变的事物时,您都可以进行预测。
为了进行预测,我们绝对需要在序列中找到常数(时间不变)分量,否则就无法通过定义进行预测。平稳性只是不变性的一个特殊情况。
时间序列是关于分析序列值依赖于先前值的方式。正如SRKX所建议的那样,可以对一个非平稳序列进行差异化或趋势化或均值化,但这不是不必要的!)来创建一个平稳序列。ARMA分析需要平稳性。如果对于每个和的分布与的分布相同,则是严格平稳的。来自Wiki:平稳过程(或严格(完全)平稳过程或强(完全)平稳过程)是随机过程,其联合概率分布在时间或空间上变化时不会改变。因此,诸如均值和方差之类的参数(如果存在)也不会随时间或位置变化。另外,正如Cardinal正确指出的那样,自相关函数必须随时间不变(这意味着协方差函数随时间恒定),并转换为ARMA模型的参数在所有时间间隔内都是不变/恒定的。
ARMA模型的平稳性思想与可逆性思想紧密相关。
考虑形式为。该模型具有爆炸性,因为多项式根在单位圆内,因此违反了要求。在单位圆内具有根的模型意味着“较旧的数据”比“较新的数据”更重要,这当然是没有意义的。
ARMA和ARIMA的建立是假设序列是固定的。如果序列不是,那么预测将是不正确的。
仅当序列平稳时,样本统计数据(均值,方差,协方差)才可用作将来行为的描述符。例如,如果序列随时间持续增加,则样本均值和方差将随样本的大小而增加,并且它们始终会低估未来期间的均值和方差。在外推拟合非平稳数据的回归模型时,请务必谨慎。
为了解决任何问题,我们需要使用静力学在数学上对方程建模。
在转换过程中,我们将获得趋势和季节性