Questions tagged «stationarity»

严格平稳的过程(或时间序列)是其联合分布随时间变化而恒定的过程。弱平稳(或协方差平稳)过程或级数是其均值和协方差函数(方差和自相关函数)不随时间变化的过程。


5
如何使时间序列平稳?
除了求差以外,还有什么其他方法可以使静止时间序列平稳? 如果可以通过滞后算子使其平稳,则通常将其称为“ p阶积分 ” 。(1−L)PXt(1−L)PXt(1-L)^P X_t

3
如何知道时间序列是固定的还是非固定的?
我使用R,我搜索在谷歌和了解到kpss.test(),PP.test()和adf.test()用来了解时间序列的平稳性。 但是我不是统计学家,他可以解释他们的结果 > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01 > kpss.test(b$V1) KPSS Test for Level Stationarity data: b$V1 KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1 Warning message: In kpss.test(b$V1) : p-value greater than …

2
为什么随机行走相互关联?
我已经观察到,平均而言,皮尔逊相关系数的绝对值是一个常数,接近于任何一对独立的随机游动,而与游动长度无关。0.560.42 有人可以解释这种现象吗? 我希望相关性会随着步长的增加而减小,就像任何随机序列一样。 在我的实验中,我使用步长均值为0且步长标准偏差为1的随机高斯步态。 更新: 我忘了以数据为中心,这就是为什么它0.56不是的原因0.42。 这是计算相关性的Python脚本: import numpy as np from itertools import combinations, accumulate import random def compute(length, count, seed, center=True): random.seed(seed) basis = [] for _i in range(count): walk = np.array(list(accumulate( random.gauss(0, 1) for _j in range(length) ))) if center: walk -= np.mean(walk) basis.append(walk / np.sqrt(np.dot(walk, walk))) …

2
相关性是否假设数据平稳?
市场间分析是一种通过查找不同市场之间的关系来对市场行为建模的方法。通常,会计算两个市场之间的相关性,比如说标准普尔500和30年期美国国债。这些计算通常不是基于价格数据,这对每个人来说都是显而易见的,它不符合固定时间序列的定义。 除了可能的解决方案(改为使用收益)以外,相关性计算(其数据是非平稳的)甚至是有效的统计计算吗? 您是否会说这样的相关性计算有些不可靠,或者只是胡说八道?


2
使用ARMA对非平稳过程进行建模的后果?
我知道我们应该使用ARIMA对非平稳时间序列进行建模。另外,我读到的所有内容都说ARMA只应用于固定时间序列。 我想了解的是,在对模型进行错误分类并假设d = 0非平稳时间序列时,在实践中会发生什么?例如: controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44) 控制数据如下所示: [1] 0.0000000 0.1240838 -1.4544087 -3.1943094 -5.6205257 [6] -8.5636126 -10.1573548 -9.2822666 -10.0174493 -11.0105225 [11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414 [16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267 [21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178 [26] …

3
一个很好的例子,其中没有单位根的序列是非平稳的?
我已经看过好几次人们在增强Dickey-Fuller检验中拒绝空值,然后声称它表明他们的序列是平稳的(不幸的是,我无法显示这些声明的来源,但是我想类似的声明在这里和那里都存在。一本或另一本日记)。 我认为这是一种误解(拒绝单位根的零点不一定与拥有平稳序列相同,尤其是因为进行此类测试时很少研究甚至不考虑非平稳性的替代形式)。 我想要的是: a)一个很好的明显反例(我现在可以想象一对夫妇,但我敢打赌,除了我以外的人会比我的想法更好)。它可能是对特定情况的描述,也许带有数据(模拟的或真实的;两者都有其优势);要么 b)一个令人信服的论点,为什么应将增强迪基-富勒中的拒绝视为建立平稳性 (如果感觉很聪明,甚至(a)和(b)都可以)

1
AR(2)平稳性的证明
考虑平均为中心的AR(2)过程Xt=ϕ1Xt−1+ϕ2Xt−2+ϵtXt=ϕ1Xt−1+ϕ2Xt−2+ϵtX_t=\phi_1X_{t-1}+\phi_2X_{t-2}+\epsilon_t其中是标准白噪声过程。为了简单起见,我将其称为和。着眼于特征方程的根,我得到 教科书中的经典条件如下:ϵtϵt\epsilon_tϕ1=bϕ1=b\phi_1=bϕ2=aϕ2=a\phi_{2}=az1,2=−b±b2+4a−−−−−−√2az1,2=−b±b2+4a2az_{1,2}=\frac{-b\pm\sqrt{b^2+4a}}{2a}{ | 一个| &lt; 1a±b&lt;1{|a|&lt;1a±b&lt;1\begin{cases}|a|<1 \\ a\pm b<1 \end{cases} 我尝试手动(在Mathematica的帮助下)解决根上的不等式,即系统仅可以恢复第三个条件()前两个彼此的解决方案得到,经过一些符号考虑,其变为?还是我缺少解决方案?⎧⎩⎨|−b−b2+4a√2a|&gt;1|−b+b2+4a√2a|&gt;1{|−b−b2+4a2a|&gt;1|−b+b2+4a2a|&gt;1\begin{cases}|\frac{-b-\sqrt{b^2+4a}}{2a}|>1 \\ |\frac{-b+\sqrt{b^2+4a}}{2a}|>1\end{cases}a±b&lt;1a±b&lt;1a \pm b<1|a|&lt;1|a|&lt;1|a|<1a+b+a−b&lt;2⇒a&lt;1a+b+a−b&lt;2⇒a&lt;1a+b+a-b<2 \Rightarrow a<1|a|&lt;1|a|&lt;1|a|<1

2
如果自回归时间序列模型是非线性的,它是否仍然需要平稳性?
关于使用递归神经网络进行时间序列预测的思考。与使用线性自回归的ARMA和ARIMA模型相比,它们基本上实现了一种广义的非线性自回归。 如果我们正在执行非线性自回归,那么时间序列是否仍需保持平稳,是否需要以与ARIMA模型相同的方式进行微分? 还是模型的非线性特征使其具有处理非平稳时间序列的能力? 换句话说,ARMA和ARIMA模型的平稳性要求(均值和方差)是由于这些模型是线性的,还是因为其他原因?

3
针对截距/漂移和线性趋势建模的时间序列的哪个Dickey-Fuller测试?
精简版: 我有一个正在测试平稳性的时间序列气候数据。根据先前的研究,我希望数据的基础模型(或可以说是“生成”)具有截距项和正线性时间趋势。为了测试这些数据的平稳性,我是否应该使用包含截距和时间趋势(即等式#3)的Dickey-Fuller检验? ∇ ÿŤ= α0+ α1个t + δÿt − 1+ 你Ť∇ÿŤ=α0+α1个Ť+δÿŤ-1个+üŤ\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t 还是我应该使用仅包含截距的DF检验,因为我认为该模型所基于的方程的第一个差异只有截距? 长版: 如上所述,我有一个时间序列的气候数据正在测试平稳性。根据先前的研究,我希望数据基础模型具有拦截项,正线性时间趋势和一些正态分布的误差项。换句话说,我希望基础模型看起来像这样: ÿŤ= 一个0+ 一个1个t + βÿŤ− 1+ 你ŤÿŤ=一种0+一种1个Ť+βÿŤ-1个+üŤy_t = a_0 + a_1t + \beta y_{t-1} + u_t 其中üŤüŤu_t是正态分布。因为我假设基础模型具有截距和线性时间趋势,所以我使用简单的Dickey-Fuller检验的方程式#3测试了单位根,如下所示: ∇yt=α0+α1t+δyt−1+ut∇yt=α0+α1t+δyt−1+uŤ\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t 该测试返回了一个临界值,该临界值将导致我拒绝原假设,并得出基本模型非平稳的结论。但是,如果我正确运用这一点,因为即使我的问题底层模型假设有一个截距和时间趋势,这并不意味着第一个区别∇yt∇yt\nabla y_t的意志为好。相反,实际上,如果我的数学正确的话。 计算基于所述方程的第一差假定的主要模型给出: ∇yt=yt−yt−1=[a0+a1t+βyt−1+ut]−[a0+a1(t−1)+βyt−2+ut−1]∇yt=yt−yt−1=[a0+a1t+βÿŤ-1个+üŤ]-[一种0+一种1个(Ť-1个)+βÿŤ-2+üŤ-1个]\nabla y_t = y_t - y_{t-1} = …

2
与增强Dickey Fuller测试混淆
我正在研究electricityR包中可用的数据集TSA。我的目的是找出arima模型是否适合此数据并最终拟合。因此,我进行如下操作: 第一个:绘制下图所示的时间序列: 第二个:我想获取对数electricity以稳定方差,然后适当地对序列进行差分,但是在这样做之前,我测试了序列的平稳性使用adf(Dickey Fuller)测试的原始数据集,令人惊讶的是,结果如下: 代码和结果: adf.test(electricity) Augmented Dickey-Fuller Test data: electricity Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 alternative hypothesis: stationary Warning message: In adf.test(electricity) : p-value smaller than printed p-value 好吧,按照我的初学者的时间序列概念,我认为这意味着数据是固定的(p值小,拒绝非平稳性的零假设)。但是,从ts曲线来看,我发现这不可能是固定的。有人对此有有效的解释吗?

2
使用带有ARIMA错误的回归进行推理的平稳性要求是什么?
使用带有ARIMA错误的回归(动态回归)进行推理的平稳性要求是什么? 具体来说,我有一个非平稳的连续结果变量,一个非平稳的连续预测变量和一个虚拟变量处理序列。我想知道治疗是否与结果变量的变化相关,该变化大于零变化之外的两个标准误差。ÿÿyX一种X一种x_aXbXbx_b 我不确定在使用ARIMA错误建模进行回归之前是否需要对这些序列进行差分处理。在回答另一个问题时,IrishStat指出的是while the original series exhibit non-stationarity this does not necessarily imply that differencing is needed in a causal model.,他然后继续补充说 unwarranted usage [of differencing] can create statistical/econometric nonsense。 该SAS用户指南表明,它是罚款,以适应回归模型ARIMA误差的非平稳序列无差分,只要残差非平稳: 请注意,平稳性要求适用于噪声序列。如果没有输入变量,则响应序列(在求和后减去平均值)和噪声序列相同。但是,如果有输入,则噪声序列是在消除输入影响后的残差。 不需要输入序列是固定的。如果输入是不稳定的,即使噪声过程可能是固定的,响应序列也将是不稳定的。 当使用非平稳输入序列时,可以在没有ARMA模型的情况下将输入变量拟合为误差,然后在确定噪声部分的ARMA模型之前考虑残差的平稳性。 另一方面,Rob Hyndman和George Athanasopoulos断言: 估计具有ARMA错误的回归的重要考虑因素是模型中的所有变量必须首先是平稳的。因此,我们首先必须检查yt和所有预测变量是否都固定。如果我们在其中任何一个都不平稳的情况下估计模型,则估计的系数可能是错误的。(x1 ,吨,… ,xķ ,吨)(X1个,Ť,…,Xķ,Ť)(x_{1,t},\dots,x_{k,t}) 一个例外是非平稳变量被共同积分的情况。如果在非平稳和预测变量之间存在线性组合,则估计的系数是正确的。ÿŤÿŤy_t 这些建议相互排斥吗?应用分析师如何进行?


2
平稳性的直观解释
我在脑海里挣扎了一段时间,这是您的想法吗?任何意见或进一步的想法将不胜感激。 平稳过程是一种生成时间序列值的过程,以使分布平均值和方差保持恒定。严格来说,这称为平稳性的弱形式或协方差/平均平稳性。 平稳性的弱形式是时间序列在整个时间中具有恒定的均值和方差。 简单地说,从业者说,平稳时间序列是没有趋势的-围绕恒定均值波动并且具有恒定方差。 不同滞后之间的协方差是恒定的,它不依赖于时间序列中的绝对位置。例如,t和t-1之间的协方差(一阶滞后)应始终相同(1960-1970年期间与1965-1975年期间或其他任何时期相同)。 在非平稳过程中,该序列不会恢复长期运行。因此,我们说非平稳时间序列并不意味着还原。在那种情况下,方差取决于时间序列中的绝对位置,并且随着时间的流逝方差变为无穷大。从技术上讲,自相关不会随时间衰减,但是在小样本中自相关确实会消失-尽管缓慢。 在固定过程中,冲击是暂时的,并且会随着时间的流逝消散(失去能量)。一段时间后,它们不会对新的时间序列值有所贡献。例如,第二次世界大战之前发生的事件(足够长的时间)产生了影响,但是今天的时间序列就像第二次世界大战从未发生过一样,我们可以说震撼失去了能量或消散。平稳性尤其重要,因为许多经典的计量经济学理论都是在平稳性的假设下得出的。 平稳性的一种强烈形式是,时间序列的分布与波谷时间完全相同。换句话说,原始时间序列的分布与滞后时间序列(有任何数量的滞后)甚至时间序列的子段完全相同。例如,强形式还表明,即使对于子细分市场1950-1960、1960-1970甚至是重叠的时期(如1950-1960和1950-1980),分布也应该相同。这种平稳形式称为强,因为它不假设任何分布。它只说概率分布应该相同。在平稳性较弱的情况下,我们通过均值和方差定义分布。我们可以简化一下,因为我们隐式地假设正态分布,正态分布完全由均值,方差或标准差定义。这只是说序列(在时间序列内)的概率测度与相同时间序列内值的滞后/移位序列的概率测度相同。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.