自相关的目的是什么?


22

为什么自相关如此重要?我已经理解了它的原理(我想..),但是也有没有自相关发生的例子,我想知道:自然界中的所有事物难道不是自相关的吗?最后一个方面的目的更多是对自相关本身的一般理解,因为,正如我提到的那样,宇宙中的每个状态不是都依赖于前一个状态吗?


1
我喜欢这个问题,尽管从我的角度来看这有点太哲学了:)我可以提供一些历史背景,这可能会有所帮助。我认为就信号处理而言,它与频谱估计有很大关系。从有限数量的数据中查看频谱估计和功率频谱密度。这可能使您了解为何自相关如此(或更确切地说)如此重要。
idnavid

4
我不明白你标题中的问题。没有目的,只是某些类型的分析中必须考虑的数据属性。为什么如此重要可能是可以回答的。
mkt-恢复莫妮卡

1
自然界中的所有事物难道不是自相关的吗?不是时间序列的现象将不会是自相关的,因为自相关是时间序列的属性(尽管存在空间相关性和其他概念,它们反映了除时间以外的其他维度上的关系)。但是由于一切都在及时发生,所以自相关可能确实很普遍。
理查德·哈迪

1
如果自然界中的所有事物都以某种方式自相关,那么在我看来,自相关是一件大事!
大卫

2
为什么自相关如此重要?” :当然,寻找 时间的结晶
纳特

Answers:


6

自相关具有几种通俗易懂的语言解释,这些解释以非自相关过程和模型不代表的方式表示:

  • 自相关变量具有其先前值的存储空间此类变量的行为取决于之前执行的操作。相对于观察期,记忆可能长或短;内存可能是无限的;记忆力可能为负(即可能振荡)。如果您的指导理论说(变量的)过去仍然存在,那么自相关就是这种表达。(例如,参见Boef,SD(2001)。建模平衡关系:具有强自回归数据的误差校正模型政治分析,9(1),78-94,以及de Boef,S.,&Keele,L.( 2008)。认真地花费时间美国政治科学杂志,52(1),184–200。)

  • 自相关变量表示动态系统我们对动态系统的行为所提出和回答的问题与我们对非动态系统所提出的问题是不同的。例如,因果效应进入系统,以及多长时间从在一个时间点的扰动影响仍然是相关回答自相关模型的语言。(例如,参见Levins,R.(1998)。《辩证法和系统理论》,《科学与社会》,62(3),375–399,以及下面的Pesaran引文。)

  • 自相关变量意味着需要时间序列建模(如果不是动态系统建模,则也是如此)。时间序列方法基于自动回归行为(和移动平均值,这是关于错误的时间相关结构的建模假设),试图捕获数据生成过程的重要细节,并且与例如,称为“纵向模型”,它简单地将时间量作为变量添加到了没有自相关的非动态模型中。参见,例如,Pesaran,MH(2015)《时间序列和面板数据》,计量经济学,纽约,纽约:牛津大学出版社。

警告:我使用“自回归”和“自回归”来暗示任何内存结构通常都是变量,而不管该过程的短期,长期,单位根,爆炸性等属性如何。


40

尝试答案。

自相关与预测变量之间的任何其他关系相同。只是预测变量和因变量恰好是同一时间序列,只是滞后了。

宇宙中的每个状态不是都取决于前一个吗?

确实是的。就像宇宙中每个物体的状态都通过各种物理力依赖于其他每个物体的状态一样。问题只是这种关系是否足够强到可以检测到,或者足够强到可以帮助我们预测状态。

同样的事情也适用于自相关。一直在那里。问题是我们是否需要对其进行建模,或者对它建模是否会引入额外的不确定性(偏差-方差的权衡),这使我们比不对其进行建模变得更糟。


我个人工作的一个例子:我预测了超市的销售。我家的牛奶消耗量很规律。如果三到四天没买牛奶,我今天或明天都会来买牛奶的机会很大。如果超市要预测我家对牛奶需求,则他们应绝对考虑这种自相关。

但是,我不是超市里唯一的顾客。可能还有2000户家庭在那里购买食品。每个人的牛奶消耗量也是自相关的。但是,由于每个人的消费率都不一样,因此总体上的自相关被大大削弱,以至于不再可能对其建模。它已经消失在一般的日常需求中,即拦截。而且,由于超市不在乎向谁出售牛奶,因此它将对需求进行建模,并且可能不包括自相关。

(是的,每周都有一个季节性。这是一种自相关,但实际上取决于星期几,而不取决于一周前同一工作日的需求,因此,与季节性自相关相比,它对工作日的影响更大。 )


+1。一个很好的例子,说明如何从整体上减少自相关。正如分布的混合会模糊在一起并混淆事物一样。(而且我一直认为零售销售预测将是一项很酷的工作!)
韦恩

26
@韦恩:是的。我告诉我的孩子,爸爸确保超市里总是有足够的冰淇淋。我想因为我的工作他们会更爱我一点。
S. Kolassa-恢复莫妮卡

8

首先,我认为您的意思是评估和处理自相关的目的是什么。如果您真的是说“自相关的目的”,那是哲学,而不是统计学。

其次,宇宙的状态与先前的状态相关,但并非每个统计问题都与自然的先前状态相关。很多研究都是横断面的。

第三,我们需要对它进行建模吗?方法做假设。大多数回归形式都假定没有自相关(也就是说,误差是独立的)。如果我们违反了这一假设,那么我们的结果可能是错误的。错了多远?一种判断方法是进行通常的回归分析,然后进行一些考虑自相关的模型(例如,多级模型或时间序列方法),并查看结果的差异。但是,我认为一般来说,考虑自相关会减少噪声并使模型更准确。


2
“那是哲学,而不是统计。” 嗯...您确定要做出如此鲜明的区分吗?毕竟,统计方法论者和科学哲学家都关心例如“预测”和“解释”之间的区别,这与自动相关模型的原因和原因密切相关。
亚历克西斯(Alexis)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.