Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

4
评估时间序列的可预测性
假设我有从05年1月到11年12月的每月超过20.000个时间序列。每个代表不同产品的全球销售数据。如果我只想关注少数几个“实际上很重要”的产品,而不是计算每个产品的预测,该怎么办? 我可以按年收入总额对这些产品进行排名,并使用经典的Pareto来精简列表。在我看来,尽管它们对底线的贡献不大,但某些产品是如此容易预测,以至于将它们拒之门外是不好的判断。在过去的10年中,每月售出价值50美元的产品听起来似乎不算什么,但它几乎不需要花太多力气就可以得出有关未来销售额的预测,我也可以这样做。 所以说我将产品分为四类:高收入/易于预测-低收入/易于预测-高收入/难以预测-低收入/难以预测。 我认为只留下那些属于第四组的时间序列是合理的。但是,我究竟该如何评估“可预测性”呢? 变异系数似乎是一个很好的起点(我也记得前一段时间看过有关它的文章)。但是,如果我的时间序列表现出季节性/水平变化/日历效应/强烈趋势怎么办? 我想我应该仅根据随机成分的可变性而不是“原始”数据之一进行评估。还是我错过了什么? 以前有没有人偶然发现过类似的问题?你们会怎么做? 一如既往,我们将不胜感激!

1
ARIMA(1,1,0)系列的仿真
我已经将ARIMA模型拟合到原始时间序列,并且最佳模型是ARIMA(1,1,0)。现在,我想从该模型中模拟系列。我编写了简单的AR(1)模型,但是我不明白如何在ARI(1,1,0)模型中调整差异。以下用于AR(1)系列的R代码是: phi= -0.7048 z=rep(0,100) e=rnorm(n=100,0,0.345) cons=2.1 z[1]=4.1 for (i in 2:100) z[i]=cons+phi*z[i-1]+e[i] plot(ts(Y)) 我如何在上面的代码中包括差异项ARI(1,1)。在这方面,任何人都可以帮助我。
11 r  time-series  arima 

2
计算复杂季节性的季节性指标
我想使用指数平滑来预测零售商品(按周)。我现在停留在如何计算,存储和应用共鸣指数上。 问题是我发现的所有示例都涉及一种简单的季节性。就我而言,我有以下问题:1.季节不是每年的同一周发生:它们是可移动的。狂欢节,借来的,复活节的和其他一些。2.有些季节会根据年份而变化。例如,有一个国家假期。根据假期是否接近周末,客户是否会离开城镇。因此,这就像有两个季节:一个是客户离开城镇的季节,另一个是他们不离开城镇的季节。3.有时两个(或三个)季节同时发生。例如,我们将“狂欢节”季节与情人节季节同时发生。 4.有时持续时间会改变。例如,“万圣节季节”是今年年初开始的。圣诞节也是另一个例子,似乎每年我们都开始提早运送产品。 在我看来,我需要找到一种方法来设置某种“季节特征”,然后根据特定情况添加某种“季节特征”以获得正确的季节指数。那有意义吗? 有人知道我在哪里可以找到有关此操作的实用信息吗? 谢谢,埃德加德


3
为什么AR(1)系数的OLS估算器有偏差?
我试图理解为什么OLS会给出AR(1)进程的有偏估计量。考虑 在此模型中,违反了严格的外生性,即和是相关的,而和是不相关的。但是,如果这是真的,那么为什么以下简单推导不成立? ý吨ε吨ý吨-1ε吨头激动 βytϵt=α+βyt−1+ϵt,∼iidN(0,1).yt=α+βyt−1+ϵt,ϵt∼iidN(0,1). \begin{aligned} y_{t} &= \alpha + \beta y_{t-1} + \epsilon_{t}, \\ \epsilon_{t} &\stackrel{iid}{\sim} N(0,1). \end{aligned} ytyty_tϵtϵt\epsilon_tyt−1yt−1y_{t-1}ϵtϵt\epsilon_tplim β^=Cov(yt,yt−1)Var(yt−1)=Cov(α+βyt−1+ϵt,yt−1)Var(yt−1)=β+Cov(ϵt,yt−1)Var(yt−1)=β.plim β^=Cov(yt,yt−1)Var(yt−1)=Cov(α+βyt−1+ϵt,yt−1)Var(yt−1)=β+Cov(ϵt,yt−1)Var(yt−1)=β. \begin{aligned} \text{plim} \ \hat{\beta} &= \frac{\text{Cov}(y_{t},y_{t-1})}{\text{Var}(y_{t-1})} \\ &=\frac{\text{Cov}(\alpha + \beta y_{t-1}+\epsilon_{t}, y_{t-1})}{\text{Var}(y_{t-1})} \\ &= \beta+ \frac{\text{Cov}(\epsilon_{t}, y_{t-1})}{\text{Var}(y_{t-1})} \\ &=\beta. \end{aligned}

3
使用Holt-Winters还是ARIMA?
我的问题是关于Holt-Winters和ARIMA之间的概念差异。 据我了解,Holt-Winters是ARIMA的特例。但是,哪种算法比另一种算法更可取呢?也许Holt-Winters是增量式的,因此可以用作内联(更快)算法? 期待在这里有一些见识。

2
AR()模型的无偏估计
考虑一个AR()模型(为简单起见,假设均值为零):ppp xt=φ1xt−1+…+φpxt−p+εtxt=φ1xt−1+…+φpxt−p+εt x_t = \varphi_1 x_{t-1} + \dotsc + \varphi_p x_{t-p} + \varepsilon_t 如最近的线程所述,已知的OLS估计量(等于条件最大似然估计量是有偏差的。φ: =( φ1个,… ,φp)φ:=(φ1,…,φp)\mathbf{\varphi} := (\varphi_1,\dotsc,\varphi_p) (奇怪的是,我找不到汉密尔顿的《时间序列分析》或其他一些时间序列教科书中提到的偏见。但是,可以在各种讲义和学术文章中找到它,例如this。) 我无法找出AR()的确切最大似然估计是否有偏差;因此,我的第一个问题。ppp 问题1:是确切的 AR(最大似然估计)模型的自回归参数偏见吗?(让我们假设AR()过程是平稳的。否则,估计量甚至是不一致的,因为它被限制在平稳区域内;请参见Hamilton的“时间序列分析”,第123页。)φ 1,... ,φ p ppppφ1,…,φpφ1,…,φp\varphi_1,\dotsc,\varphi_pppp 也, 问题2:是否有任何合理简单的无偏估计量?

1
了解分数微分公式
我有一个时间序列,我想它建模为一个分整(又名FARIMA)过程。如果y t是(分数)阶d的积分,我想对其进行分数差分以使其固定。ÿŤÿŤy_tÿŤÿŤy_tddd 问题:以下定义分数微分的公式正确吗? ΔdÿŤ:= yŤ- dÿt − 1+ d(d− 1 )2 !ÿt − 2- d(d− 1 )(d− 2 )3 !ÿt − 3+ 。。。+ (− 1 )k + 1d(d− 1 )⋅ 。。。⋅ (d− k )ķ !ÿ吨- ķ+ 。。。ΔdÿŤ:=ÿŤ-dÿŤ-1个+d(d-1个)2!ÿŤ-2-d(d-1个)(d-2)3!ÿŤ-3+。。。+(-1个)ķ+1个d(d-1个)⋅。。。⋅(d-ķ)ķ!ÿŤ-ķ+。。。\Delta^d y_t := y_t - d y_{t-1} + \frac{d(d-1)}{2!} y_{t-2} - \frac{d(d-1)(d-2)}{3!} y_{t-3} + …

2
如何对每日时间序列数据中的月度效果建模?
我有两个时间序列的每日数据。一个是订阅sign-ups,另一个terminations是订阅。我想使用两个变量中包含的信息来预测后者。 从这些系列的图表来看,很明显终止与前几个月的签约倍数相关。也就是说,5月10日的注册人数激增,将导致6月10日,7月10日和8月10日的终止人数增加,依此类推,尽管这种影响逐渐减弱。 我希望获得有关我可以采用哪种模型来建模此特定问题的提示。任何建议将不胜感激。 到目前为止,我一直在考虑一个VAR模型,但是我不确定如何包括月度影响-使用非常高的滞后量或以某种方式添加季节性成分?

3
在R中创建自相关随机值
我们正在尝试创建自动相关的随机值,将其用作时间序列。我们没有引用的现有数据,仅想从头开始创建向量。 一方面,我们当然需要具有分布及其SD的随机过程。 另一方面,必须描述影响随机过程的自相关。该向量的值与在几个时间间隔内强度的降低自相关。例如lag1有0.5,lag2 0.3,lag1 0.1等。 所以最后向量应该看起来像这样:2、4、7、11、10、8、5、4、2,-1、2、5、9、12、13、10、8、4、3, 1,-2,-5 等等。

5
如何比较2个非平稳时间序列以确定相关性?
我有两个数据系列,绘制了随时间推移的死亡中位数。这两个系列都显示出随着时间的推移死亡年龄会增加,但比另一个低得多。我想确定较低样本的死亡年龄增加是否与较高样本的死亡年龄明显不同。 以下是按年份(从1972年到2009年,包括1972年)排序的数据,四舍五入到小数点后三位: Cohort A 70.257 70.424 70.650 70.938 71.207 71.263 71.467 71.763 71.982 72.270 72.617 72.798 72.964 73.397 73.518 73.606 73.905 74.343 74.330 74.565 74.558 74.813 74.773 75.178 75.406 75.708 75.900 76.152 76.312 76.558 76.796 77.057 77.125 77.328 77.431 77.656 77.884 77.983 Cohort B 5.139 8.261 6.094 12.353 11.974 11.364 …

4
按时间顺序解释什么?
到目前为止,到目前为止主要处理横截面数据,最近才进行浏览,扫描了大量的时间序列入门文献,我不知道解释变量在时间序列分析中将扮演什么角色。 我想解释一个趋势而不是趋势。作为引言,我所读的大部分内容都假定该系列文章源于某种随机过程。我了解了AR(p)和MA流程以及ARIMA建模。除了自动回归过程之外,我还想处理更多信息,所以我找到了VAR / VECM并运行了一些示例,但我仍然想知道是否存在某些案例与横截面上的解释更接近。 其背后的动机是我的系列分解表明趋势是主要的贡献者,而余数和季节性影响几乎没有作用。我想解释一下这种趋势。 我可以/应该将我的系列回归多个不同的系列吗?凭直觉,由于串行相关性,我会使用gls(我不太确定cor结构)。我听说过虚假回归,并且知道这是一个陷阱,但是我正在寻找一种解释趋势的方法。 这是完全错误还是不常见?还是我到目前为止错过了正确的章节?


1
使用R预测包中的TBATS解释时间序列分解
我想将以下时间序列数据分解为季节性,趋势和残差组分网。数据是来自商业建筑的每小时冷却能源概况: TotalCoolingForDecompose.ts <- ts(TotalCoolingForDecompose, start=c(2012,3,18), freq=8765.81) plot(TotalCoolingForDecompose.ts) 因此,基于以下建议,每天和每周都有明显的季节性影响:如何分解具有多个季节性成分的时间序列?,我使用tbats了forecast软件包中的函数: TotalCooling.tbats <- tbats(TotalCoolingForDecompose.ts, seasonal.periods=c(24,168), use.trend=TRUE, use.parallel=TRUE) plot(TotalCooling.tbats) 结果是: 此模型的level和slope组件描述什么?如何获得trend与remainder该软件包所引用的论文相似的,和组件(De Livera,Hyndman和Snyder(JASA,2011年))?

2
使用ARMA-GARCH模型模拟外汇价格
我已经将ARIMA(1,1,1)-GARCH(1,1)模型拟合到几年中以一分钟为间隔采样的澳元/美元汇率记录价格的时间序列,估计模型的上百万个数据点。该数据集可在此处获得。为了清楚起见,这是一个ARMA-GARCH模型,由于对原木价格进行一阶整合,因此适合对原木进行回报。原始的AUD / USD时间序列如下所示: 然后,我尝试根据拟合模型模拟时间序列,从而得到以下结果: 我既期望也希望模拟的时间序列与原始时间序列不同,但是我并不期望会有如此大的差异。从本质上讲,我希望模拟的序列的行为或大致看起来像原始序列。 这是我用来估计模型和模拟序列的R代码: library(rugarch) rows <- nrow(data) data <- (log(data[2:rows,])-log(data[1:(rows-1),])) spec <- ugarchspec(variance.model = list(model = "sGARCH", garchOrder = c(1, 1)), mean.model = list(armaOrder = c(1, 1), include.mean = TRUE), distribution.model = "std") fit <- ugarchfit(spec = spec, data = data, solver = "hybrid") sim <- ugarchsim(fit, …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.