Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

1
HMM在量化金融中的使用。可以检测趋势/转折点的HMM示例?
我正在发现所谓的“隐马尔可夫模型”(也称为“制度转换模型”)的奇妙世界。我想在R中使用HMM来检测趋势和转折点。我想建立尽可能通用的模型,以便可以在许多价格上对其进行测试。 谁能推荐一篇论文?我已经看过(并阅读)了(不止)一些,但是我正在寻找一个易于实现的简单模型。 另外,建议使用哪些R软件包?我可以看到有很多人在做HMM。 我已经买了《时间序列的隐马尔可夫模型:使用R的介绍》这本书,让我们看一下其中的内容吧;) 弗雷德


3
针对截距/漂移和线性趋势建模的时间序列的哪个Dickey-Fuller测试?
精简版: 我有一个正在测试平稳性的时间序列气候数据。根据先前的研究,我希望数据的基础模型(或可以说是“生成”)具有截距项和正线性时间趋势。为了测试这些数据的平稳性,我是否应该使用包含截距和时间趋势(即等式#3)的Dickey-Fuller检验? ∇ ÿŤ= α0+ α1个t + δÿt − 1+ 你Ť∇ÿŤ=α0+α1个Ť+δÿŤ-1个+üŤ\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t 还是我应该使用仅包含截距的DF检验,因为我认为该模型所基于的方程的第一个差异只有截距? 长版: 如上所述,我有一个时间序列的气候数据正在测试平稳性。根据先前的研究,我希望数据基础模型具有拦截项,正线性时间趋势和一些正态分布的误差项。换句话说,我希望基础模型看起来像这样: ÿŤ= 一个0+ 一个1个t + βÿŤ− 1+ 你ŤÿŤ=一种0+一种1个Ť+βÿŤ-1个+üŤy_t = a_0 + a_1t + \beta y_{t-1} + u_t 其中üŤüŤu_t是正态分布。因为我假设基础模型具有截距和线性时间趋势,所以我使用简单的Dickey-Fuller检验的方程式#3测试了单位根,如下所示: ∇yt=α0+α1t+δyt−1+ut∇yt=α0+α1t+δyt−1+uŤ\nabla y_t = \alpha_0+\alpha_1t+\delta y_{t-1}+u_t 该测试返回了一个临界值,该临界值将导致我拒绝原假设,并得出基本模型非平稳的结论。但是,如果我正确运用这一点,因为即使我的问题底层模型假设有一个截距和时间趋势,这并不意味着第一个区别∇yt∇yt\nabla y_t的意志为好。相反,实际上,如果我的数学正确的话。 计算基于所述方程的第一差假定的主要模型给出: ∇yt=yt−yt−1=[a0+a1t+βyt−1+ut]−[a0+a1(t−1)+βyt−2+ut−1]∇yt=yt−yt−1=[a0+a1t+βÿŤ-1个+üŤ]-[一种0+一种1个(Ť-1个)+βÿŤ-2+üŤ-1个]\nabla y_t = y_t - y_{t-1} = …


3
ETS()函数,如何避免与历史数据不一致的预测?
我正在研究R中的alogorithm,以使每月预测计算自动化。除其他外,我正在使用预报包中的ets()函数来计算预报。运行良好。 不幸的是,对于某些特定的时间序列,我得到的结果很奇怪。 请在下面找到我正在使用的代码: train_ts<- ts(values, frequency=12) fit2<-ets(train_ts, model="ZZZ", damped=TRUE, alpha=NULL, beta=NULL, gamma=NULL, phi=NULL, additive.only=FALSE, lambda=TRUE, lower=c(0.0001,0.0001,0.0001,0.8),upper=c(0.9999,0.9999,0.9999,0.98), opt.crit=c("lik","amse","mse","sigma","mae"), nmse=3, bounds=c("both","usual","admissible"), ic=c("aicc","aic","bic"), restrict=TRUE) ets <- forecast(fit2,h=forecasthorizon,method ='ets') 请在下面的相关历史数据集下面找到: values <- c(27, 27, 7, 24, 39, 40, 24, 45, 36, 37, 31, 47, 16, 24, 6, 21, 35, 36, 21, 40, 32, 33, …

2
时间序列预测中的随机与确定性趋势/季节关系
我在时间序列预测方面有中等背景。我看了几本预测书,但在其中任何一本中都没有看到以下问题。 我有两个问题: 如果给定的时间序列具有以下特征,我将如何客观地确定(通过统计检验): 随机季节性或确定性季节性 随机趋势或确定性趋势 如果当时间序列具有明显的随机成分时,将我的时间序列建模为确定性趋势/季节,将会发生什么? 解决这些问题的任何帮助将不胜感激。 趋势的示例数据: 7,657 5,451 10,883 9,554 9,519 10,047 10,663 10,864 11,447 12,710 15,169 16,205 14,507 15,400 16,800 19,000 20,198 18,573 19,375 21,032 23,250 25,219 28,549 29,759 28,262 28,506 33,885 34,776 35,347 34,628 33,043 30,214 31,013 31,496 34,115 33,433 34,198 35,863 37,789 34,561 36,434 34,371 …

1
R中的多元时间序列。如何找到滞后相关性并建立预测模型
我是该页面的新手,而统计学和R则是新手。我正在为一个大学项目,目的是发现河流中的雨水和水位之间的相关性。一旦证明了相关性,我便要对其进行预测/预测。 数据 我有一组数年的数据(每隔5分钟)包含特定的河流: 毫米降水 河流流量,立方米每秒 这条河没有积雪,因此该模型仅基于降雨和时间。有时会有冻结的温度,但是我正在考虑将这些时间段从异常数据中删除,因为这种情况超出了我项目的范围。 示例 在这里,您有几个示例数据图,这些数据来自几个小时后的降雨和水位上升。 红线是河流流量。橙色是雨。您可以看到总是下雨,然后河里的水上升。在时间序列结束时会再次下雨,但稍后会影响河流流量。 相关性在那里。这是我在R中所做的,以证明在R中使用ccf的相关性: 互相关 前导变量 滞后 这是我的R线用于第二个示例(一个降雨期): ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain") 我的解释是: 降雨导致(首先发生), 有一个显着的相关性,其峰值为(我可以检查确切的数字,我知道该部分)。≈ 450≈450\approx 450 我不知道如何找出相关性影响河流流量的时间,我认为这个名称是“保留”。我看到的是,雨后河水流失时,该图遵循第一个图的相同形状。我不能以此为依据说保留时间从持续到(我可以在返回的数据框中创建的对象中检查此值,看看水位何时恢复到该值)。是“下雨前”吗?有没有更好的方法来找到保留物?≈ 450≈450\approx 450≈ 800≈800\approx 800ccf 我对吗? 关于时间序列。此时间序列没有周期性或季节性。随时可能下雨并造成影响。夏季确实会减少,但仍然会发生,这是一个常年下雨的地区。 模型和预测。 我不知道如何创建一个模型来进行预测,该预测告诉我在下雨后河流会增加多少流量。我一直在尝试一些arima,auto arima但是还没有很成功。我应该使用Arima,vars或其他不同的多变量模型?任何指向示例的链接都会有很大帮助。 请让我知道,如果您知道创建此预测的最佳方法,则应使用哪种模型。我正在考虑做其他一些事情,但是为了简单起见,将它们从解释中删除。如果需要,我可以共享一些数据。

2
与增强Dickey Fuller测试混淆
我正在研究electricityR包中可用的数据集TSA。我的目的是找出arima模型是否适合此数据并最终拟合。因此,我进行如下操作: 第一个:绘制下图所示的时间序列: 第二个:我想获取对数electricity以稳定方差,然后适当地对序列进行差分,但是在这样做之前,我测试了序列的平稳性使用adf(Dickey Fuller)测试的原始数据集,令人惊讶的是,结果如下: 代码和结果: adf.test(electricity) Augmented Dickey-Fuller Test data: electricity Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01 alternative hypothesis: stationary Warning message: In adf.test(electricity) : p-value smaller than printed p-value 好吧,按照我的初学者的时间序列概念,我认为这意味着数据是固定的(p值小,拒绝非平稳性的零假设)。但是,从ts曲线来看,我发现这不可能是固定的。有人对此有有效的解释吗?

1
设置STL窗口宽度的标准
使用R进行STL分解,s.window控制如何快速的季节性成分可以改变。较小的值允许更快速的更改。将季节性窗口设置为无穷大等效于将季节性分量强制为周期性(即跨年相同)。 我的问题: 如果我有一个每月的时间序列(即频率等于),应该使用什么标准设置?121212s.window 那和时间序列频率之间有联系吗?

1
多站点研究的混合模型vs.合并标准误差-为什么混合模型效率更高?
我有一个数据集,其中包含来自多个站点的一系列“断棍”月度病例计数。我正在尝试从两种不同的技术中获得一个汇总估算值: 技术1:将Poisson GLM的“折断棒”安装到指标变量0/1上,并使用时间和时间^ 2变量来控制时间趋势。该0/1指标变量的估计值和SE是使用相当精确的矩量法向上或向下合并的,或者使用R中的tlnise包来合并以获得“贝叶斯”估计值。这类似于Peng和Dominici处理空气污染数据的方法,但站点数量较少(约十二个)。 技术2:放弃一些针对特定地点的时间趋势控件,并使用线性混合模型。尤其: lmer(cases ~ indicator + (1+month+I(month^2) + offset(log(p)), family="poisson", data=data) 我的问题涉及这些估计得出的标准误差。技术1的标准误差实际上使用的是每周一次而不是每月的时间设置,因此应该具有更高的精度。对于矩量法,估计的标准误差为〜0.206,对于tise的估计值则为〜0.306。 lmer方法给出的标准误差约为0.09。效果估计值是相当接近的,因此似乎并不是因为混合模型的效率大大提高,它们只是在不同的摘要估计值上归零。 这是合理的期望吗?如果是这样,为什么混合模型效率更高?这是普遍现象,还是该模型的特定结果?

3
Auto.arima和autobox有何不同?
通过阅读该站点上的帖子,我知道有一个R 函数 auto.arima(在forecast 包中)。我也知道,IrishStat,这个网站的会员,建立了商业包装autobox在80年代初。由于这两个软件包已存在,并且会自动为给定的数据集选择Arima模型,它们有何不同之处?他们是否可能针对同一数据集产生不同的模型?

1
解释格兰杰因果关系检验的结果
我正在尝试对格兰杰因果关系进行自我教育。我已经阅读了该网站上的帖子以及在线上的几篇好文章。我还遇到了一个非常有用的工具,即“双变量Granger因果关系-免费统计计算器”,该工具可让您输入时间序列并计算Granger Stats。下面是站点中包含的示例数据的输出。我在解释结果方面也很努力。 我的问题: 我的解释方向正确吗? 我忽略了哪些关键见解? 另外,CCF图表的含义和解释是什么?(我假设CCF是互相关的。) 这是我已经解释的结果和图: Summary of computational transaction Raw Input view raw input (R code) Raw Output view raw output of R engine Computing time 2 seconds R Server 'Herman Ole Andreas Wold' @ wold.wessa.net Granger Causality Test: Y = f(X) Model Res.DF Diff. DF F p-value …

1
预测短时间序列的最小愚蠢方法
我需要为第29个时间单位预测以下4个变量。我有大约2年的历史数据,其中1和14和27都是同一时期(或一年中的某个时间)。最后,我对w ^w ^W,w ^ dwdwd,w çwCwc和进行了Oaxaca-Blinder风格的分解ppp。 time W wd wc p 1 4.920725 4.684342 4.065288 .5962985 2 4.956172 4.73998 4.092179 .6151785 3 4.85532 4.725982 4.002519 .6028712 4 4.754887 4.674568 3.988028 .5943888 5 4.862039 4.758899 4.045568 .5925704 6 5.039032 4.791101 4.071131 .590314 7 4.612594 4.656253 4.136271 .529247 8 4.722339 4.631588 3.994956 …



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.