Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

4
R中ARIMA残差的Ljung-Box统计信息:令人困惑的测试结果
我正在尝试预测一个时间序列,为此我使用了季节性ARIMA(0,0,0)(0,1,0)[12]模型(= fit2)。它与R关于auto.arima的建议不同(R计算得出的ARIMA(0,1,1)(0,1,0)[12]会更好,我将其命名为fit1)。但是,在我的时间序列的最后12个月,我的模型(fit2)在调整后似乎更合适(长期存在偏差,我添加了剩余均值,新的拟合似乎更贴近原始时间序列这是过去12个月的示例,MAPE最近12个月的两种情况: 时间序列如下所示: 到目前为止,一切都很好。我对这两个模型都进行了残差分析,这就是困惑。 acf(resid(fit1))看起来很棒,非常白噪声: 但是,Ljung-Box测试不适用于例如20个滞后: Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1) 我得到以下结果: X-squared = 26.8511, df = 19, p-value = 0.1082 据我了解,这是对残差不是独立的确认(p值太大,无法与独立假设一起保留)。 但是,对于滞后1来说,一切都很好: Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1) 给我结果: X-squared = 0.3512, df = 0, p-value < 2.2e-16 我可能不理解该测试,或者与我在acf图上看到的有些矛盾。自相关性很低。 然后我检查了fit2。自相关函数如下所示: 尽管在最初的几个滞后处存在如此明显的自相关,但Ljung-Box测试在20个滞后处给我的结果比fit1好得多: Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0) 结果是 : X-squared = 147.4062, df = 20, p-value < 2.2e-16 而仅仅在lag1处检查自相关,也可以得到零假设的证实! Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0) X-squared = 30.8958, …


2
了解R的增强Dickey Fuller测试中的k滞后
我在R中进行了一些单位根测试,但我不完全确定k lag参数的含义。我使用了tseries软件包中的增强Dickey Fuller测试和Philipps Perron测试。显然,默认的参数(用于)仅取决于序列的长度。如果选择不同的我得到的结果将完全不同。拒绝null:ķķkadf.testķķk Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272 alternative hypothesis: stationary # 103^(1/3)=k=4 Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543 alternative hypothesis: stationary # k=0 Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542 alternative hypothesis: stationary # k=6 加上PP测试结果: …
15 r  time-series  trend 

1
如何解释负ACF(自相关函数)?
因此,我绘制了回油的ACF / PACF,并期望看到一些正的自相关,但令我惊讶的是,我只得到了负的显着自相关。我应该如何解释上图?他们似乎表明,当石油收益率先前下降时,有回升的趋势,反之亦然,从而出现了振荡行为。如果我错了,请纠正我。


3
为什么在RNN中通过时间反向传播?
在递归神经网络中,通常会向前传播几个时间步骤,“展开”网络,然后在输入序列中向后传播。 为什么不只在序列中的每个步骤之后更新权重?(等效于使用1的截断长度,因此没有展开的空间),这完全消除了消失的梯度问题,大大简化了算法,可能会减少陷入局部极小值的机会,并且最重要的是看起来工作正常。我以这种方式训练了一个模型来生成文本,结果似乎与从BPTT训练后的模型中看到的结果相当。我对此仅感到困惑,因为我所见过的每个有关RNN的教程都说要使用BPTT,几乎就像是正确学习所必需的那样,事实并非如此。 更新:我添加了一个答案

5
时间序列计量经济学和面板数据计量经济学有什么区别?
这个问题可能很幼稚,但是如果时间序列方法和面板数据方法之间存在差异,那么我对计量经济学的教学方式就会感到困惑。 关于时间序列,我涵盖了诸如协方差平稳,AR,MA等主题。关于面板数据,我只看到了固定效应与随机效应(或更笼统地说是分层模型),差异-差异等 这些主题是否在某些方面相关?由于面板数据也具有时间维度,因此为什么也没有讨论AR,MA等问题? 如果答案是我对面板方法的教育还远远不够,那么您能指出一本书不仅仅涉及FE / RE和差异吗?

1
在指数平滑模型中处理丢失的数据
在指数平滑模型家族的背景下,似乎没有一种标准的方法来处理丢失的数据。特别是,在预测包中称为ets的R实现似乎只占用了最长的子序列,而没有丢失数据,Hyndman等人的《带指数平滑的预测》一书也是如此。似乎根本没有谈论丢失数据。 如果我的用户明确要求我(并且丢失的数据不会出现得太近或出现的时间间隔恰好相隔一个季节),我想做更多的事情。特别要注意的是以下几点。在模拟过程中,每当我会遇到一个丢失值,我将替代当前点预报〜ý吨为ÿ 吨,使得ε 吨 = 0。例如,这将使数据点在参数优化过程中不被考虑。ÿŤÿŤy_tÿ〜Ťÿ〜Ť\tilde y_tÿŤÿŤy_tεŤ= 0εŤ=0\varepsilon_t = 0 一旦我对参数有合理的拟合度,就可以估计误差的标准偏差(假设是平均值为),并验证使用从该分布生成的ϵ t值不会将可能性大幅度降低。我也将这些值用于预测(使用模拟)。000ϵŤϵŤ\epsilon_t 此方法是否存在已知的陷阱?

1
如果相关,如何从另一个时间序列预测一个时间序列
一年多来,我一直在试图解决这一问题,但进展不大。它是我正在做的一个研究项目的一部分,但我将用我编写​​的一个故事示例进行说明,因为问题的实际范围有点令人困惑(视线跟踪)。 您是一架追踪穿越海洋的敌舰的飞机,因此您已收集了该舰的一系列(x,y,time)坐标。您知道,一艘隐藏的潜艇会随船一起航行以保护它,但是尽管它们的位置之间存在关联,但潜艇经常会从船上滑落,因此虽然它通常在船的附近,但是它也可能在船的另一侧世界偶尔。您想预测潜艇的路径,但不幸的是,它对您而言是隐藏的。 但是在4月份的一个月中,您会注意到潜艇忘记隐藏自己,因此您在进行1000次航行时都对潜艇和船只具有一系列坐标。使用这些数据,您想建立一个模型,以仅考虑船的运动来预测隐藏式潜艇的路径。天真的基准就是说“潜艇位置猜测=”船的当前位置”,但是从4月份可见潜艇的数据中,您会注意到潜艇有可能稍微领先于船舶,因此“潜艇位置“猜测= 1分钟内的位置”是一个更好的估计。此外,4月份的数据显示,当船舶停泊在水中一段较长的时间时,潜艇很可能不在沿海水域巡逻。还有其他模式当然。 以四月份的数据作为训练数据,您将如何构建该模型来预测潜艇的航行路线?我当前的解决方案是临时线性回归,其中因素包括“行程时间”,“船的x坐标”,“船闲置1天”等,然后让R找出权重并进行交叉验证。 。但是,我真的很喜欢从四月份的数据自动生成这些因素的方法。另外,使用序列或时间的模型会很好,因为线性回归不适用,而且我认为这很重要。 感谢您通读所有内容,我很乐意澄清所有内容。

2
金融/经济学研究中不规则的时间序列
在金融计量经济学研究中,以每日数据的形式调查金融时间序列之间的关系非常普遍。例如,通常通过取对数差将变量设为;LN (P 吨)- LN (P 吨- 1)。I(0)I(0)I(0)ln(Pt)−ln(Pt−1)ln⁡(Pt)−ln⁡(Pt−1)\ln(P_t)-\ln(P_{t-1}) 但是,每日数据意味着有555每周数据点,而星期六和星期日则丢失。在我所知道的应用文献中,这似乎没有提及。这是我根据观察得出的一些密切相关的问题: 即使金融市场在周末休市,这是否也属于不规则间隔的数据? 如果是这样,那么迄今为止,大量的忽略该问题的论文对现有经验结果的有效性有何影响?

1
在文献中是否知道这种重新采样时间序列的方法?它有名字吗?
我最近在寻找重新采样时间序列的方法, 大约保留长存储进程的自相关。 保留观测值的范围(例如,重新采样的整数时间序列仍然是整数的时间序列)。 如果需要,可能只影响某些比例尺。 我针对长度为的时间序列提出了以下排列方案:2N2N2^N 通过成对的连续观测值对时间序列进行分类(有这样的分类)。分别以概率翻转它们中的每一个(即,从索引到)。2N−12N−12^{N-1}1:22:11/21/21/2 通过连续的观察值对获得的时间序列进行分类(其中有这样的分类)。用概率反转它们中的每一个(即从索引到索引)独立性。2 N - 24442N−22N−22^{N-2}1:2:3:44:3:2:11/21/21/2 与尺寸的仓重复该步骤,,...,总是逆转与概率仓。16 2 Ñ - 1 1 / 28881616162N−12N−12^{N-1}1/21/21/2 这种设计纯粹是经验性的,我正在寻找已经针对这种排列发布的作品。我也乐于接受其他排列或重采样方案的建议。

2
关于逻辑回归的问题
我想运行一个二元logistic回归模型,以在10年内(1997-2006年)从一组自变量中模拟冲突(因变量)的存在与否,每年有107个观测值。我的独立人是: 土地退化(针对两种退化类型); 人口增加(0-否; 1-是); 生计类型(0-1型; 1-2-2型); 人口密度(三种密度水平); NDVI连续(最大蔬菜生产率); NDVI t − 1(比上一年的蔬菜下降-0-否; 1-是)和t−1t−1_{t-1} 和NDVI t − 2(从两年后的蔬菜开始下降-0-否; 1-是)。t−2t−2_{t-2} 我对此很陌生-这是我的讲师给我的一个项目-因此,我将感谢您的一些建议或指导。我已经测试了多大学衔。 本质上,我的数据被划分为107个观测单位(空间区域),覆盖了10年(总共1070年),对于每个观测单位,它给出的是当时该单位内独立变量条件的“快照”值(区域)。我想知道如何设置逻辑回归(或表格)以分别识别每年的107个值,以便可以评估不同单位年之间的时间NDVI变化吗?

3
有人可以解释动态时间扭曲以确定时间序列相似性吗?
我正在尝试掌握动态时间扭曲量度以将时间序列一起比较。我有三个时间序列数据集,如下所示: T1 <- structure(c(0.000213652387565, 0.000535045478866, 0, 0, 0.000219346347883, 0.000359669104424, 0.000269469145783, 0.00016051364366, 0.000181950509461, 0.000385579332948, 0.00078170803205, 0.000747244535774, 0, 0.000622858922454, 0.000689084895259, 0.000487983408564, 0.000224744353298, 0.000416449765747, 0.000308388157895, 0.000198906016907, 0.000179549331179, 9.06289650172e-05, 0.000253506844685, 0.000582896161212, 0.000386473429952, 0.000179839942451, 0, 0.000275608635737, 0.000622665006227, 0.00036075036075, 0.00029057097196, 0.000353232073472, 0.000394710874285, 0.000207555002076, 0.000402738622634, 0, 0.000309693403531, 0.000506521463847, 0.000226988991034, 0.000414164423276, 9.6590360282e-05, 0.000476689865573, 0.000377572210685, 0.000378967314069, 9.25240562546e-05, 0.000172309813044, 0.000447627573859, …

2
ARMA / ARIMA与混合效果建模有何关系?
在面板数据分析中,我使用了具有随机/混合效应的多级模型来处理自相关问题(即,观察结果随时间聚集在个体中),并添加了其他参数以调整一些时间规格和感兴趣的冲击。ARMA / ARIMA似乎旨在解决类似问题。 我在网上找到的资源讨论了时间序列(ARMA / ARIMA)或混合效应模型,但是除了建立在回归之上之外,我不了解两者之间的关系。可能要在多层次模型中使用ARMA / ARIMA吗?两者之间是等效还是多余? 讨论此问题的资源的答案或指针将是很棒的。

2
Box-Jenkins选型
时间序列分析中的Box-Jenkins模型选择过程从查看序列的自相关和部分自相关函数开始。这些图可以建议ARMA (p ,q )模型中的适当和q。通过要求用户应用AIC / BIC标准来选择那些具有白噪声误差项的模型中最简化的模型,从而继续执行该过程。pppqqq(p,q)(p,q)(p,q) 我想知道这些目视检查和基于标准的模型选择步骤如何影响最终模型的估计标准误差。我知道,例如,横截面域中的许多搜索过程都会使标准误向下偏移。 第一步,通过查看数据(ACF / PACF)选择适当的滞后次数如何影响时间序列模型的标准误差? 我猜想根据AIC / BIC分数选择模型会产生与横截面方法类似的影响。我实际上对这方面也不了解,所以在这一点上任何评论也将不胜感激。 最后,如果您写下用于每个步骤的精确标准,是否可以引导整个过程来估计标准误差并消除这些担忧?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.