Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

2
微观计量经济学中的因果关系与时间序列计量经济学中的格兰杰因果关系
我了解微观经济学(尤其是IV或回归不连续性设计)中使用的因果关系,以及时间序列计量经济学中使用的Granger因果关系。如何将彼此联系起来?例如,我已经看到两种方法都用于面板数据(例如,T = 20)。在这方面对论文的任何引用将不胜感激。ñ= 30N=30N=30Ť= 20T=20T=20

3
不确定性的几种测量的标准偏差
我有两个2个小时的GPS数据,采样率为1 Hz(7200次测量)。中的数据形式给出,其中Ñ σ是测量不确定性。(X,Xσ,Y,Yσ,Z,Zσ)(X,Xσ,Y,Yσ,Z,Zσ)(X, X_\sigma, Y, Y_\sigma, Z, Z_\sigma)ñσNσN_\sigma 当我取所有测量值的平均值(例如,这两个小时的平均Z值)时,其标准偏差是多少?我当然可以从Z值计算出标准偏差,但是后来我忽略了已知的测量不确定性这一事实... 编辑:数据全部来自同一测站,并且每秒重新测量所有坐标。由于卫星星座等原因,每次测量都具有不同的不确定性。我的分析目的是找出由于外部事件(例如地震)引起的位移。我想取地震前7200次测量的平均值(2h),取地震后2h的另一个平均值,然后计算所得的差值(例如,高度)。为了指定此差异的标准偏差,我需要知道两种方法的标准偏差。

2
ARIMA vs ARMA在不同系列上
在R(2.15.2)中,我在一个时间序列上安装了一次ARIMA(3,1,3),在一次有差异的时间序列上安装了一次ARMA(3,3)。拟合参数不同,这归因于ARIMA中的拟合方法。 同样,无论我使用哪种拟合方法,在与ARMA(3,3)相同的数据上拟合ARIMA(3,0,3)都不会得到相同的参数。 我有兴趣确定差异的出处以及可以使用哪些参数(如果有的话)拟合ARIMA,以获得与ARMA相同的拟合系数。 示例代码演示: library(tseries) set.seed(2) #getting a time series manually x<-c(1,2,1) e<-c(0,0.3,-0.2) n<-45 AR<-c(0.5,-0.4,-0.1) MA<-c(0.4,0.3,-0.2) for(i in 4:n){ tt<-rnorm(1) t<-x[length(x)]+tt+x[i-1]*AR[1]+x[i-2]*AR[2]+x[i-3]*AR[3]+e[i-1]*MA[1]+e[i-2]*MA[2]+e[i-3]*MA[3] x<-c(x,t) e<-c(e,tt) } par(mfrow=c(2,1)) plot(x) plot(diff(x,1)) #fitting different versions. What I would like to get is fit1 with ARIMA() fit1<-arma(diff(x,1,lag=1),c(3,3),include.intercept=F) fit2<-arima(x,c(3,1,3),include.mean=F) fit3<-arima(diff(x,1),c(3,0,3),include.mean=F) fit4<-arima(x,c(3,1,3),method="CSS",include.mean=F) fit5<-arima(diff(x,1),c(3,0,3),method="CSS",include.mean=F) cbind(fit1$coe,fit2$coe,fit3$coe,fit4$coe,fit5$coe) 编辑:使用条件平方和来的很接近,但还不完全是。感谢您对fit1的提示! Edit2:我不认为这是重复的。第2点和第3点解决的问题与我的不同,即使我重写了第1点提到的初始化, fit4<-arima(x,c(3,1,3),method="CSS",include.mean=F,init=fit1$coe) 我仍然得到不同的系数
13 r  time-series  arima  fitting  arma 

4
auto.arima()是否识别出模型?
我一直在尝试学习和应用ARIMA模型。我一直在阅读Pankratz撰写的关于ARIMA的精彩文章- 使用单变量Box-Jenkins模型进行预测:概念和案例。在本文中,作者在选择ARIMA模型时特别强调了简约原则。 我开始使用R包预测中的auto.arima()函数。这是我所做的,我模拟了ARIMA,然后应用。以下是两个示例。正如您在两个示例中看到的那样,清楚地确定了许多人认为不简约的模型。尤其是在示例2中,在该示例中标识ARIMA(3,0,3)的时间实际上是ARIMA(1,0,1)就足够了,而且是简约的。auto.arima()auto.arima()auto.arima() 以下是我的问题。我将不胜感激任何建议。 是否有关于何时使用/修改通过自动算法识别的模型的指南auto.arima()? 仅使用AIC(我认为auto.arima()使用)来识别模型是否有任何困难? 可以建立一个简约的自动算法吗? 顺便说一下,我auto.arima()只是作为一个例子。这将适用于任何自动算法。 以下是示例1: set.seed(182) y <- arima.sim(n=500,list(ar=0.2,ma=0.6),mean = 10) auto.arima(y) qa <- arima(y,order=c(1,0,1)) qa 以下是的结果auto.arima()。请注意,所有系数都不重要。即值<2。Ťtt ARIMA(1,0,2) with non-zero mean Coefficients: ar1 ma1 ma2 intercept 0.5395 0.2109 -0.3385 19.9850 s.e. 0.4062 0.4160 0.3049 0.0878 sigma^2 estimated as 1.076: log likelihood=-728.14 AIC=1466.28 AICc=1466.41 BIC=1487.36 以下是arima()使用ARIMA(1,0,1)顺序常规运行的结果 Series: …

3
ARMA(2,1)过程的自协方差
我需要为ARMA(2,1)进程的自协方差函数导出解析表达式,γ(k)γ(k)\gamma\left(k\right)表示为: yt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵtyt=ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵty_t=\phi_1y_{t-1}+\phi_2y_{t-2}+\theta_1\epsilon_{t-1}+\epsilon_t 因此,我知道: γ(k)=E[yt,yt−k]γ(k)=E[yt,yt−k]\gamma\left(k\right) = \mathrm{E}\left[y_t,y_{t-k}\right] 所以我可以写: γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]γ(k)=ϕ1E[yt−1yt−k]+ϕ2E[yt−2yt−k]+θ1E[ϵt−1yt−k]+E[ϵtyt−k]\gamma\left(k\right) = \phi_1 \mathrm{E}\left[y_{t-1}y_{t-k}\right]+\phi_2 \mathrm{E}\left[y_{t-2}y_{t-k}\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_{t-k}\right]+\mathrm{E}\left[\epsilon_{t}y_{t-k}\right] 然后,要导出自协方差函数的解析版本,我需要替换kkk -0、1、2 ...的值,直到获得对大于某个整数的所有有效的递归kkk。 因此,我将k=0k=0k=0并通过计算得出: γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt]γ(0)=E[yt,yt]=ϕ1E[yt−1yt]+ϕ2E[yt−2yt]+θ1E[ϵt−1yt]+E[ϵtyt] \gamma \left(0\right) = \mathrm{E}\left[y_t,y_t\right] = \phi_1 \mathrm{E}\left[y_{t-1}y_t\right] + \phi_2 \mathrm{E}\left[y_{t-2}y_t\right]+\theta_1 \mathrm{E}\left[\epsilon_{t-1}y_t\right]+\mathrm{E}\left[\epsilon_ty_t\right]\\ 现在,我可以简化这些术语的前两个,然后像以前一样替换:ytyty_t γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]γ(0)=ϕ1γ(1)+ϕ2γ(2)+θ1E[ϵt−1(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)]+E[ϵt(ϕ1yt−1+ϕ2yt−2+θ1ϵt−1+ϵt)] \gamma\left(0\right) = \phi_1 \gamma\left(1\right) + \phi_2 \gamma\left(2\right)\\ + \theta_1 \mathrm{E}\left[\epsilon_{t-1} \left(\phi_1 y_{t-1} +\phi_2 y_{t-2} +\theta_1 \epsilon_{t-1} + \epsilon_t \right)\right]\\ …

2
具有异方差测量误差的AR(1)过程
1.问题 我对变量进行了一些测量,其中,我通过MCMC获得了分布,为简单起见,我将其假设为均值的高斯和方差。ytyty_tt=1,2,..,nt=1,2,..,nt=1,2,..,nfyt(yt)fyt(yt)f_{y_t}(y_t)μtμt\mu_tσ2tσt2\sigma_t^2 对于这些观察,我有一个物理模型,例如,但是残差似乎是相关的;特别是,我有物理上的理由认为流程足以考虑相关性,因此我计划通过MCMC获得拟合系数,为此我需要可能性。我认为解决方案很简单,但是我不太确定(它看起来很简单,以至于我遗漏了一些东西)。g(t)g(t)g(t)rt=μt−g(t)rt=μt−g(t)r_t = \mu_t-g(t)AR(1)AR(1)AR(1) 2.推导可能性 零均值流程可写为: 其中,我假设。因此,要估计的参数为(在我的情况下,我还必须添加模型的参数,但这不是问题)。但是,我观察到的是变量 ,其中我假设和是已知的(测量误差)。因为是高斯过程,所以也是。我特别知道 X 吨 = φ X 吨- 1 + ε 吨,(1 )ε 吨〜Ñ (0 ,σ 2 瓦特)θ = { φ ,σ 2 瓦特 } 克(吨)- [R 吨 = X 吨 + η 吨,(2 )η 吨〜ñ (AR(1)AR(1)AR(1)Xt=ϕXt−1+εt, (1)Xt=ϕXt−1+εt, (1)X_t = \phi X_{t-1}+\varepsilon_t,\ \ …

1
面板数据模型中一组内的标准化因变量?
在识别组中对因变量进行标准化是否有意义? 以下工作文件(法律亚马逊地区的森林砍伐放缓;价格或政策?,pdf)使用标准化的因变量来分析巴西总体政策变化对森林砍伐的影响。 标准化按如下方式完成: Ynewit=Yit−Yi¯¯¯¯¯sd(Yit)Yitnew=Yit−Yi¯sd(Yit) Y^{new}_{it} = \frac{Y_{it} - \overline{Y_i}}{sd(Y_{it})} 作者认为,这是为了“考虑市政当局内森林砍伐增量的相对变化”。作者特此使用面板数据的有限元估计(第12页)。新法律出台后的每一年都应包括一个后政策假人。 如果以这种方式标准化因变量,应该如何解释系数? 标准化不是非正统的吗,因为它为群体/市镇随时间变化较小的观测值提供了更高的价值?

4
插值可保留每周平均值的流感数据
编辑 我找到了一篇准确描述我所需程序的论文。唯一的不同是,论文将每月均值数据插值到每日,同时保留了每月均值。我很难在中实施该方法R。任何提示表示赞赏。 原版的 对于每周,我有以下计数数据(每周一个值): 医生会诊数 流感病例数 我的目标是通过插值获得每日数据(我想到了线性或截断的样条曲线)。重要的是,我要保留每周平均值,即每日内插数据的平均值应等于本周的记录值。此外,插值应平滑。可能出现的一个问题是某个星期少于7天(例如,在一年的开始或结束时)。 对此,我将不胜感激。 非常感谢。 以下是1995年的示例数据集(已更新): structure(list(daily.ts = structure(c(9131, 9132, 9133, 9134, 9135, 9136, 9137, 9138, 9139, 9140, 9141, 9142, 9143, 9144, 9145, 9146, 9147, 9148, 9149, 9150, 9151, 9152, 9153, 9154, 9155, 9156, 9157, 9158, 9159, 9160, 9161, 9162, 9163, 9164, 9165, 9166, 9167, 9168, …

2
自相关如何处理?
为此,我有相当深的数学背景,但是我从未真正涉及过时间序列或统计建模。所以你不必对我很温柔:) 我正在阅读有关对商业建筑中的能源使用进行建模的论文,作者提出了这一主张: [出现自相关的出现]是因为该模型是根据能源使用的时间序列数据开发的,该数据固有地是自相关的。时间序列数据的任何纯确定性模型都将具有自相关。如果在模型中包含[更多傅里叶系数],则会发现自相关会降低。但是,在大多数情况下,傅立叶模型的CV较低。因此,该模型对于实际用途而言可能是可以接受的,但实际上并不需要很高的精度。 0.)“时间序列数据的任何纯确定性模型将具有自相关”是什么意思?我可以模糊地理解这是什么意思,例如,如果您有0个自相关,那么您如何期望预测时间序列中的下一个点?可以肯定,这不是一个数学论点,这就是为什么它是0的原因:) 1.)我的印象是自相关基本上杀死了您的模型,但考虑到这一点,我不明白为什么会这样。那么,自相关为什么不好(或好)呢? 2.)我听到的关于自相关的解决方案是区分时间序列。如果没有尝试读取笔者的脑海,为什么一个没有,如果不可忽略的自相关存在做一个差异? 3.)不可忽略的自相关对模型有哪些限制?这是某个假设吗(即使用简单线性回归建模时的正态分布残差)? 无论如何,如果这些是基本问题,我们深表歉意,并在此先感谢您的帮助。

3
AR(1)是马尔可夫过程吗?
诸如的AR(1)进程 是马尔可夫过程吗?ÿŤ= ρ ÿt − 1+ εŤyt=ρyt−1+εty_t=\rho y_{t-1}+\varepsilon_t 如果是,那么VAR(1)是马尔可夫过程的向量版本吗?

2
进行约翰逊协整检验时选择滞后的正确程序是什么?
在对2个时间序列(简单情况)进行约翰逊协整测试时,您需要确定要使用的滞后时间。对不同的滞后进行测试会返回不同的结果:对于某些滞后水平,原假设可以被拒绝,而对于其他滞后则不能。 我的问题是,基于输入数据的正确方法是什么,以确定在执行约翰逊测试时需要使用哪些滞后? ps我将这个问题提交给了quant.stackexchange,但有人认为它更适合该小组。

3
通常的回归与变量不同时的回归
我只是想了解当变量不同时,正常多元/简单回归与多元/简单回归之间的关系。 例如,我正在分析存款余额()与市场利率()之间的关系。如果运行简单的线性回归,则相关性为负且非常显着(大约-.74)。但是,如果我采用对数和因变量和自变量之差,所以我的方程现在是与回归,我的相关性和R ^ 2根本不重要()。ř Ť dÿŤYTY_T[RŤRTR_Tddln(是Ť)dln⁡(YT)d\, \ln(Y_T)R 2 = .004d[R (Ť)dR(T)d\, R(T)[R2= .004R2=.004R^2 = .004 我只是想知道这样低的甚至意味着什么吗?这是否意味着我的模型不合适,或者在查看差异数据时是否忽略了?从数据中我知道原始的两个变量之间存在显着的相关性,但是对于我的模型,我需要查看不同的变量,因此只是想知道如何解决这个问题。R 2[R2R2R^2[R2R2R^2

1
使用时间序列交叉验证计算预测误差
我有一个时间序列的预测模型,我想计算其样本外预测误差。目前,我遵循的策略是Rob Hyndman的博客(在页面底部附近)建议的策略(假设时间序列和大小为的训练集)y1,…,yny1,…,yny_1,\dots,y_nkkk 使模型适合数据并让作为下一个观测值的预测。yt,…,yt+k−1yt,…,yt+k−1y_t,\dots,y_{t+k-1}y^t+ky^t+k\hat{y}_{t+k} 将预测误差计算为。et=y^t+k−yt+ket=y^t+k−yt+ke_{t} = \hat{y}_{t+k} - y_{t+k} 重复t=1,…,n−kt=1,…,n−kt=1,\dots,n-k 将均方误差计算为MSE=1n−k∑n−kt=1e2tMSE=1n−k∑t=1n−ket2\textrm{MSE}=\frac{1}{n-k}\sum_{t=1}^{n-k} e_t^2 我的问题是,由于我的训练集重叠,我有多少需要担心相关性。特别要说的是,我不仅要预测下一个值,还要预测接下来的值,这样我就可以预测\ hat {y} _ {t + k},\ dots,\ hat {y} _ {t + k + m-1}和错误e_ {t,1},\ dots,e_ {t,m},我想构造一个预测错误的术语结构。mmmy^t+k,…,y^t+k+m−1y^t+k,…,y^t+k+m−1\hat{y}_{t+k},\dots,\hat{y}_{t+k+m-1}et,1,…,et,met,1,…,et,me_{t,1},\dots,e_{t,m} 我是否仍可以每次将训练集的窗口向前滚动1个,还是应该向前滚动mmm?如果我要预测的序列中存在显着的自相关,那么这些问题的答案将如何改变(可以想象这是一个长记忆过程,即自相关函数随幂定律而不是指数衰减。) 我希望在这里提供解释,也可以链接到可以找到有关MSE(或其他误差度量)的置信区间的理论结果的地方。

1
重叠数据的时间序列回归
我看到了一个回归模型,该模型正在回归滞后(12个月)的按年股票指数回报率,相同股票指数的按年回报率,信用利差(无风险债券和公司债券的月均值之差)收益率),同比通胀率和工业生产同比指数。 因此看起来(尽管在这种情况下,您可以替换印度的特定数据): SP500YOY(T) = a + b1*SP500YOY(T-12) + b2*CREDITSPREAD(T) + b4*INDUSTRIALPRODUCTION(T+2) + b3*INFLATION(T+2) + b4*INFLATIONASYMM(T+2) SP500YOY是SP500指数的按年回报。要计算此值,请计算SP500值的每月平均值,然后转换为每个月的按年回报(即Jan'10-Jan'11,Feb'10- 11月2日,3月10日至11月3日...)。在解释变量方面,SP500YOY的12个月滞后值与时间T处的CREDITSPREAD以及提前两个月的INFLATION和INDUSTRIALPRODUCTION一起使用。对于通货膨胀率是否高于阈值5.0%,INFLATIONASYMM是一个虚拟对象。括号中的索引显示每个变量的时间索引。 这是通过标准OLS线性回归估算的。要使用此模型预测SP500的同比1,2和3个月的同比回报,就必须对通货膨胀和工业生产指数产生3-4和5个月的提前预测。这些预测是在将ARIMA模型分别适合两个模型之后进行的。提前1,2和3个月的CreditSpread预测只是作为心理估计。 我想知道这种OLS线性回归是正确/不正确,有效/无效还是普遍有效的统计实践。 我看到的第一个问题是使用重叠数据。即,将股票指数的每日价值每月平均,然后用于计算按月结转的年收益。这应该使错误项自相关。我认为必须在以下其中一种情况下使用“更正”: 怀特的异方差一致性协方差估计器 Newey&West异方差和自相关一致(HAC)估计量 Hans&Hodrick的异方差一致版本 对这些重叠数据应用标准OLS线性回归(不进行任何校正)是否真的有意义,并且更进一步,使用3周期ARIMA提前预测值作为解释变量,以在原始OLS线性回归中预测SP500YOY?我以前从未见过这样的形式,因此,除非对重叠观察的使用进行校正,否则无法真正判断它。

1
套索的LARS与坐标下降
使用LARS [1]与使用坐标下降来拟合L1正则化线性回归有什么优缺点? 我主要对性能方面感兴趣(我的问题往往有N成千上万且p小于20。)但是,任何其他见解也将受到赞赏。 编辑:自从我发布问题以来,chl亲切地指出了Friedman等人的论文[2],其中坐标下降比其他方法快得多。如果是这样,作为执业医生,我是否应该忘掉LARS来支持协调下降? [1]埃弗隆·布拉德利;海蒂·特雷弗;约翰·斯通,伊恩和蒂布希拉尼·罗伯特(2004)。“最小角度回归”。统计年鉴32(2):第407-499页。 [2] Jerome H. Friedman,Trevor Hastie,Rob Tibshirani,“通过坐标下降的广义线性模型的正则化路径”,《统计软件》,第1卷。33,第1期,2010年2月。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.