如何测试残差的自相关?


23

我有一个包含两列的矩阵,这两列具有很多价格(750)。在下图中,我绘制了线性回归的残差:

lm(prices[,1] ~ prices[,2])

看图像,似乎是残差的很强的自相关。

但是,如何测试这些残差的自相关性是否强?我应该使用什么方法?

线性回归的残差

谢谢!


8
您不需要测试自相关。在那里。该图显示了这一点。您可以查看这些残差的自相关函数(函数acf()),但这将简单地确认用肉眼可以看到的:滞后残差之间的相关性非常高。
沃尔夫冈

@Wolfgang,是的,正确,但是我必须以编程方式进行检查。.我将看一下acf函数。谢谢!
众议院

@Wolfgang,我看到的是acf(),但是我看不到某种p值来了解是否存在强相关性。如何解释其结果?感谢
Dail

在H0:相关性(r)= 0的情况下,r遵循正态/ t dist,均值为0,且方差为sqrt(观察次数)。因此,您可以使用+/-qt(0.75, numberofobs)/sqrt(numberofobs)
吉姆

@Jim相关的方差不是 。标准偏差也不是n。但是它确实有一个nnñ
Glen_b-恢复莫妮卡2014年

Answers:


17

可能有很多方法可以做到这一点,但是想到的第一个方法是基于线性回归的。您可以使连续残差彼此相对回归,并测试明显的斜率。如果存在自相关,则连续残差之间应该存在线性关系。要完成您编写的代码,您可以执行以下操作:

mod = lm(prices[,1] ~ prices[,2])
res = mod$res 
n = length(res) 
mod2 = lm(res[-n] ~ res[-1]) 
summary(mod2)

模2是时间的线性回归误差,ε ,相对于时间- 1个误差,ε - 1。如果res [-1]的系数显着,则表明残差具有自相关的证据。ŤεŤŤ-1个εŤ-1个

注:此隐含的假设是残差在这个意义上是自回归,只有预测何时是很重要的ε 牛逼。实际上,可能存在更长的范围依赖性。在那种情况下,我描述的这种方法应该解释为对ε中的真实自相关结构的一次滞后自回归近似。εŤ-1个εŤε


非常感谢您提供的示例。仅有一个疑问,我该如何测试res [-1]是否有意义?
众议院

你会测试它就像任何其他的回归系数相同的方式-看 t-统计和p -值Ťp

使用lm(rnorm(1000)〜jitter(1:1000))进行快速测试我得到:残留标准误差:997自由度上的1.006多个R平方:0.0003463,调整后R平方:-0.0006564 F统计:1和997 DF上的0.3454,p值:0.5569 p值不能拒绝原假设
Dail Dail

宏,我已经测试了上面绘制的图表的残差,结果是:残差标准误差:747自由度上的0.04514多个R平方:0.9241,调整后R平方:0.924 F统计:1上的9093 747 DF,p值:<2.2e-16,它看起来不太好,这很奇怪,因为存在很强的自相关,我该怎么办?
Dail

3
这称为自相关的Breusch-Godfrey检验。
查理

16

使用在lmtest软件包中实现的Durbin-Watson测试

dwtest(prices[,1] ~ prices[,2])

我很奇怪:p值<2.2e-16,怎么可能?数据似乎非常相关!
众议院

4
如果没有真正的相关性,则p值可能会获得与观察到的相关性一样多的相关性。因此,如果p很小,则表明样本中存在很多相关性。
罗布·海恩德曼

您是说像这样的p值表示残差是非常自相关的吗?
众议院

嗯,很奇怪,请看一下:imageshack.us/f/59/17671620.png正确的图像怎么可能没有自相关?
众议院

:dail似乎左侧图像具有方差的结构变化(有关详细信息,请参阅Ruey Tsay的文章“时间序列中的离群值,水平移动和方差变化”,Journal of Forecasting,VOl 7,1-20(1988))。在这种情况下,它不会“混淆” DW,这可能是因为整个分布仍然是正常的,而正确的图像具有一些视觉上明显的(凭经验可识别的)异常(脉冲),从而产生了非正常的(leptokurtotic,参见wikopedia:一种分布)具有正超额峰度被称为尖峰厚尾)分布导致破坏与DW
IrishStat

11

DW检验或线性回归检验对数据异常的鲁棒性不强。如果您有脉搏,季节性脉搏,水平移动或本地时间趋势,则这些测试是无用的,因为这些未处理的组件会增加误差的方差,从而向下偏置测试,导致您(如您所知)错误地接受否定假设自相关。在可以使用这两个测试或我知道的任何其他参数测试之前,必须“证明”残差的平均值在统计学上与0.0 EVERYWHERE并无显着差异,否则基本假设无效。众所周知,DW测试的限制条件之一是其假设回归误差呈正态分布。请注意,除其他因素外,正态分布均值:无异常(请参见http://homepage.newschool.edu/~canjels/permdw12.pdf)。此外,DW测试仅测试滞后1的自相关。您的数据可能会产生每周/季节性影响,这将无法诊断,而且未经处理,将使DW测试产生偏差。


有哪些检验残差与零显着不同的检验?如果回归包括截距,那么残差均值为零,因此我很好奇如何解决这个问题。
mpiktas 2011年

:mpkitas正如您所说的,当您包含一个常数时,误差的平均值保证为0.0,但这并不保证误差的平均值在任何地方都为零。例如,如果一个系列的均值发生变化,则总体均值将是一个常数,但会产生tw0个“簇”的残差,每个残差均具有不同的均值。您可以阅读Ruey Tsay的文章“时间序列中的离群值,水平移动和方差变化”,Journal of Forecasting,VOl 7,1-20(1988),以获取详细信息。或faculty.chicagobooth.edu/ruey.tsay/teaching/uts/lec10-08.pdf或Google“自动干预检测”
IrishStat,

1
这只是所有回归分析中隐含的标准“无遗漏变量”假设。
查理
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.