时间序列与回归之间的关系和差异?


12

时间序列和回归之间的关系和区别是什么?

对于模型和假设,回归模型假设输入变量的不同值在输出变量之间具有独立性,而时间序列模型不是,这是否正确?还有什么其他区别?

有关方法,请访问达灵顿网站

时间序列分析有多种方法,但是最著名的两种方法是回归方法和Box-Jenkins(1976)或ARIMA(自回归综合移动平均)方法。本文档介绍了回归方法。我认为回归方法远远优于ARIMA,主要有以下三个原因

我不太了解网站上的时间序列“回归方法”是什么,它与Box-Jenkins或ARIMA方法有何不同。我很高兴有人可以对这些问题发表一些见解。

感谢致敬!


2
此处大多数答案和评论都集中在最后的更具体的问题上。这只是一个标志,表明时间序列分析远比Box-Jenkins或ARIMA大得多。时间序列分析的整个领域都具有完全不同的(至少是更一般的)焦点。未观察到的组件模型只是几个示例之一。
Nick Cox

Answers:


17

我真的认为这是一个很好的问题,应该得到答案。提供的链接由一名心理学家撰写,他声称某种自制方法比Box-Jenkins是进行时间序列分析的更好方法。我希望我的答案能够鼓励其他对时间序列了解更多的人做出贡献。

从他的介绍看来,达林顿似乎拥护只用最小二乘法拟合AR模型的方法。也就是说,如果您要拟合模型 到时间序列,则只需将序列回归到序列上即可lag,lag,依此类推,直到lag,使用普通的多元回归。这当然是允许的;在R中,它甚至是函数中的一个选项。我对其进行了测试,它倾向于为在R中拟合AR模型的默认方法提供类似的答案。

zt=α1zt1++αkztk+εt
ztzt12kar

他还主张回归的东西像或权力到能找到趋势。同样,这绝对没问题。许多时间序列书籍都对此进行了讨论,例如Shumway-Stoffer和Cowpertwait-Metcalfe。通常,时间序列分析可能遵循以下几行:找到趋势,将其删除,然后将模型拟合到残差。zttt

但是似乎他也提倡过度拟合,然后使用拟合系列和数据之间均方误差的减小来证明他的方法更好。例如:

我觉得相关图已经过时了。他们的主要目的是让工作人员猜测哪些模型最适合数据,但是现代计算机的速度(至少在回归分析中,如果没有在时间序列模型中进行拟合)可以使工作人员简单地拟合多个模型并确切地了解每个均方根均方差拟合。[偶然性大写的问题与该选择无关,因为两种方法同样容易受到此问题的影响。]

这不是一个好主意,因为模型的测试应该是可以预测的程度,而不是如何适合现有数据。在他的三个示例中,他使用“调整后的均方根误差”作为拟合质量的标准。当然,过度拟合模型会使样本中的误差估计值变小,因此他声称自己的模型“较好”,因为它们的RMSE较小,这是错误的。

简而言之,由于他使用错误的标准来评估模型的良好程度,因此他得出​​关于回归与ARIMA的错误结论。我敢打赌,如果他改为测试模型的预测能力,ARIMA将会名列前茅。如果有人可以访问他在这里提到书,也许可以尝试一下

[补充:有关回归概念的更多信息,您可能需要查看在ARIMA变得最流行之前编写的较旧的时间系列书籍。例如,Kendall,《时间序列》,1973年,第11章整章介绍了这种方法以及与ARIMA的比较。]


问题是(固有的)区别是什么?
hbaghishani

据我所知,作者从未在同行评审的出版物中描述过他的自酿方法,并且从统计文献中引用和引用的文献似乎很少,并且他关于方法论主题的主要出版物可以追溯到70年代。严格来说,这没有一个“证明”的方法,但是如果没有足够的时间或专业知识来自己评估这些主张,我将非常不愿意使用其中的任何一个。
晚会

@hbaghishani的实质区别是自相关数据(即,每个系列中的数据)扭曲了互相关的解释。此外,还需要考虑/纠正高斯违规,例如错误的均值恒定,随时间变化的恒定变化,随时间变化的恒定参数。
IrishStat

@flounderer人们写教科书来出售它们并获得奖励。它们有时包括不合时宜的方法,这些方法被错误地教导,因为在较早的日期它们被认为是正确的。为了增加销售量,出版商经常(根据我的个人经验)要求使用过时但不正确的方法,因为这些方法在教学大纲中。
IrishStat

@IrishStat建模自相关数据可以通过动态回归模型完成。同样,其他模型(例如混合模型)也可以用于此类数据。因此,我认为此功能不是实质性区别。
hbaghishani

7

E. Parzen教授也许有点羡慕他没有提出Box和Jenkins的创新方法,但他提出了这种过度拟合然后下台的方法。它失败的原因有很多(Flounderer很好地总结了很多原因),包括没有识别和补救脉搏,水平移动,季节性脉搏和当地时间趋势。另外,需要考虑参数随时间的变化或误差方差随时间的变化。

我写了一篇您可能感兴趣的文章。它被称为“回归与Box-Jenkins”,可从http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting获得/ doc_download / 24-regression-vs-box-jenkins

关于达灵顿过程的一则评论反映了时间,时间*时间,时间*时间*时间*时间作为预测变量。在没有干预检测导致孤立异常值的情况下,很可能(而且不正确!)得出更高的时间幂结论。提防非统计学家进行统计分析,因为您会警惕统计学家进行脑部手术。公平地讲,人们可能还要提防非时间序列统计学家/数学家试图在时间序列分析中接受有限培训的情况下执行时间序列分析。

此列表中的其他海报(尤其是胡扯)反复警告不要使用这种“拟合方法”,主要是在单变量环境中。此警告也适用于因果模型。

希望这可以帮助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.