Questions tagged «time-series»

时间序列是随时间(连续时间或离散时间段)观察到的数据。

2
时间序列中可逆过程的直觉是什么?
我正在阅读有关时间序列的书,并且在以下部分开始挠头: 有人可以为我解释直觉吗?我无法从这段文字中得到它。为什么我们需要过程是可逆的?这里的概况如何?感谢您的任何帮助。我在这方面是新手,所以如果您可以在解释时使用学生级别的术语:)
19 time-series  arma 

2
假设检验及其对时间序列的意义
查找两个总体时,通常的显着性检验是t检验,如果可能的话,配对t检验。这假设分布是正态的。 是否存在类似的简化假设,可以对时间序列进行显着性检验?具体来说,我们有两只老鼠,它们的数量相对较小,接受不同的治疗,并且我们每周测量一次体重。两张图均显示平滑增加的功能,其中一张图绝对高于另一张图。在这种情况下,我们如何量化“确定性”? 零假设应该是随着时间的流逝,两个总体的权重“以相同的方式表现”。如何用一个仅包含少量参数的相当普遍(就像正态分布一样普遍)的简单模型来表述呢?一旦做到这一点,一个人怎么能测量重要性或类似于p值的东西?如何配对小鼠,使其具有尽可能多的特征,并且每对具有两个种群中的一个代表? 我欢迎您找到有关时间序列的一些相关的,写得很好且易于理解的书或文章。我从无知开始。谢谢你的帮助。 大卫·爱泼斯坦

3
一个很好的例子,其中没有单位根的序列是非平稳的?
我已经看过好几次人们在增强Dickey-Fuller检验中拒绝空值,然后声称它表明他们的序列是平稳的(不幸的是,我无法显示这些声明的来源,但是我想类似的声明在这里和那里都存在。一本或另一本日记)。 我认为这是一种误解(拒绝单位根的零点不一定与拥有平稳序列相同,尤其是因为进行此类测试时很少研究甚至不考虑非平稳性的替代形式)。 我想要的是: a)一个很好的明显反例(我现在可以想象一对夫妇,但我敢打赌,除了我以外的人会比我的想法更好)。它可能是对特定情况的描述,也许带有数据(模拟的或真实的;两者都有其优势);要么 b)一个令人信服的论点,为什么应将增强迪基-富勒中的拒绝视为建立平稳性 (如果感觉很聪明,甚至(a)和(b)都可以)

2
平滑-什么时候使用它,什么时候不使用?
威廉·布里格斯(William Briggs)的博客上有一篇很旧的文章,着眼于平滑数据的陷阱,并将平滑后的数据用于分析。关键参数是: 如果在一个疯狂的时刻,您对时间序列数据进行平滑处理并将其用作其他分析的输入,那么您将大大增加欺骗自己的可能性!这是因为平滑会感应出虚假信号,这些信号对于其他分析方法而言似乎是真实的。无论您做什么,都无法确定最终结果! 但是,我正在努力寻找有关何时进行平滑处理以及何时不进行平滑处理的全面讨论。 当使用该平滑数据作为其他分析的输入时,它只是不愿进行平滑处理吗?还是不建议进行平滑处理?相反,在某些情况下建议进行平滑处理吗?

5
检测时间序列的变化(R示例)
我想检测通常具有相同形状的时间序列数据的变化。到目前为止,我已经使用changepointR和cpt.mean(), cpt.var()and cpt.meanvar()函数的软件包。cpt.mean()当数据通常保持在一个级别时,使用PELT方法的效果很好。但是,我也想检测下降期间的变化。我要检测的一个变化示例是黑色曲线突然下降而实际上应遵循示例性红色虚线的部分。我已经尝试过cpt.var()函数,但是无法获得良好的结果。您是否有任何建议(不必使用R)? 这是具有更改的数据(作为R对象): dat.change <- c(12.013995263488, 11.8460207231808, 11.2845153487846, 11.7884417180764, 11.6865425802022, 11.4703118125303, 11.4677576899063, 11.0227199625084, 11.274775836817, 11.03073498338, 10.7771805591742, 10.7383206158923, 10.5847230134625, 10.2479315651441, 10.4196381241735, 10.467607842288, 10.3682422713283, 9.7834431752935, 9.76649842404295, 9.78257968297228, 9.87817694914062, 9.3449034905713, 9.56400153361727, 9.78120084558148, 9.3445162813738, 9.36767436354887, 9.12070987223648, 9.21909859069157, 8.85136359917466, 8.8814423003979, 8.61830163359642, 8.44796977628488, 8.06957847272046, 8.37999165387824, 7.98213210294954, 8.21977468333673, 7.683960439316, 7.73213584532496, 7.98956476021092, 7.83036046746187, 7.64496198988985, 4.49693528397253, 6.3459274845112, 5.86993447552116, …

1
,预测期的模拟
我有时间序列数据,我使用ARIMA(p,d,q)+XtARIMA(p,d,q)+XtARIMA(p,d,q)+X_t作为拟合数据的模型。的XtXtX_t是指示随机变量,它是0(当我没有看到一个罕见的事件)或1(当我看到的罕见的事件)。基于我对先前观察XtXtX_t,我可以使用可变长度马尔可夫链方法开发的模型XtXtX_t。这使我能够在预测期间内模拟XtXtX_t并给出零和一的序列。由于这是罕见的事件,我不会看到Xt=1Xt=1X_t=1 。我可以根据的模拟值预测并获取预测间隔XtXtX_t。 题: 如何在预测期内考虑到模拟中1的出现,开发一种有效的模拟程序XtXtX_t?我需要获取均值和预测间隔。 观察到1的概率太小,以至于我认为常规的蒙特卡洛模拟在这种情况下会很好地工作。也许我可以使用“重要性抽样”,但是我不确定到底该怎么做。 谢谢。


2
如何用一阶差分变量解释回归?
我有两个时间序列: 代表市场风险溢价(ERP;红线) 由政府债券代理的无风险利率(蓝线) 我想测试无风险利率能否解释ERP。在此,我基本上遵循了Tsay(2010,第3版,第96页)的建议:Financial Time Series: 拟合线性回归模型并检查残差的序列相关性。 如果残差序列是单位根非平稳性,则将因变量和解释变量的第一个差值作为第一个差。 第一步,我得到以下结果: Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 6.77019 0.25103 26.97 <2e-16 *** Risk_Free_Rate -0.65320 0.04123 -15.84 <2e-16 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 如该图所示,该关系是负的并且是重要的。但是,残差是序列相关的: 因此,我首先要区分因变量和解释变量。这是我得到的: Coefficients: Estimate Std. Error t …

4
移动平均模型误差项
这是Box-Jenkins MA模型的基本问题。据我了解,MA模型基本上是时间序列值对先前误差项的线性回归。也就是说,观测值首先针对其先前值回归,然后将一个或多个值用作MA的误差项模型。YYYet,...,et−net,...,et−ne_t,..., e_{t-n}YYYYt−1,...,Yt−nYt−1,...,Yt−nY_{t-1}, ..., Y_{t-n}Y−Y^Y−Y^Y - \hat{Y} 但是,如何在ARIMA(0,0,2)模型中计算误差项?如果使用MA模型时没有自回归部分,因此没有估计值,那么我怎么可能有一个误差项?

5
数据清理会使统计分析的结果恶化吗?
在流行期间,由于病毒传播(例如2002年美国的西尼罗河病毒),人民抵抗力下降,食物或水的污染减少,蚊子。这些流行病将以每1至5年发生一次的异常值出现。通过消除这些异常值,我们将消除流行病的证据,这些证据构成了预测和疾病理解的重要组成部分。 在处理由流行病引起的异常值时是否需要清理数据? 是要改善结果还是使统计分析结果恶化?

3
逻辑回归和数据集结构
我希望我能以正确的方式问这个问题。我可以访问逐个播放的数据,因此,最好的方法和正确构建数据的问题更多。 我要做的是根据给定的分数和时间来计算赢得NHL比赛的概率。我认为我可以使用逻辑回归,但不确定数据集的外观。在我感兴趣的每场比赛中,每场比赛我都会有多个观察结果吗?我会每场比赛进行一次观察并在每个时间段内使用单独的模型吗?逻辑回归甚至是正确的方法吗? 您能提供的任何帮助将不胜感激! 最好的祝福。

2
是否可以自动化时间序列预测?
我想构建一种算法,该算法能够分析任何时间序列,并“自动”为分析的时间序列数据选择最佳的传统/静态预测方法(及其参数)。 可以做这样的事情吗?如果是,您能给我一些如何解决的技巧吗?

2
如果自回归时间序列模型是非线性的,它是否仍然需要平稳性?
关于使用递归神经网络进行时间序列预测的思考。与使用线性自回归的ARMA和ARIMA模型相比,它们基本上实现了一种广义的非线性自回归。 如果我们正在执行非线性自回归,那么时间序列是否仍需保持平稳,是否需要以与ARIMA模型相同的方式进行微分? 还是模型的非线性特征使其具有处理非平稳时间序列的能力? 换句话说,ARMA和ARIMA模型的平稳性要求(均值和方差)是由于这些模型是线性的,还是因为其他原因?

4
术语“时间序列分析”和“纵向数据分析”之间有什么区别
在谈论纵向数据时,我们可能会重复引用从同一主题/研究单位随时间收集的数据,因此,同一主题内的观察存在相关性,即主题内相似度。 在谈论时间序列数据时,我们还引用了一系列时间收集的数据,这似乎与上述纵向设置非常相似。 我想知道是否有人可以在这两个术语之间提供清晰的说明,它们之间的关系是什么,区别是什么?

5
如何在线性回归模型中添加周期分量?
我有一些累积频率数据。线y=ax+by=ax+by=ax+b看起来非常适合数据,但是该行中存在循环/周期性摆动。我想估计累积频率何时达到一定值ccc。当我绘制残差与拟合值的关系图时,我得到了漂亮的正弦曲线行为。 现在,要增加另一个复杂性,请注意在残差图中 有两个周期的值比其他周期低,这表示还必须考虑到周末效应。 那么,我从这里去哪里呢?如何将一些余弦,正弦或循环项合并到回归模型中,以得到近似值。估计何时累积频率等于?ccc

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.