关于样本自协方差函数的问题


10

我正在阅读时间序列分析书,样本自协方差的公式在书中定义为:

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

与对于。是平均值。γ^(h)=γ^(h)h=0,1,...,n1x¯

有人可以直观地解释为什么我们将总和除以而不是吗?这本书解释说,这是因为上面的公式是一个非负的确定函数,因此最好除以,但这对我来说还不清楚。有人可以证明这一点,还是可以举例说明?nnhn

对我而言,起初直观的事情就是除以。这是对自协方差的无偏估计吗?nh


1
如果你的时间序列是完全与所有其他,或是未知的,则总和必然在停止时在发生总和:将包含在总和中的下一项(对于)将具有和不是示例的一部分。x1,x2,,xnxii<1i>nt=nhxt+h=xnt=nh+1xnh+1+h=xn+1xn+1
Dilip Sarwate

@Dilip我不认为这是问题所在:问题涉及在的定义中除以还是。nnhγ^
whuber

Answers:


14

γ^用于创建协方差矩阵:给定“时间”,它估计随机向量(从随机字段获得)是矩阵。对于许多问题,例如预测,至关重要的是所有这些矩阵都必须是非奇异的。作为推定协方差矩阵,显然它们不能具有任何负特征值,因此它们都必须都是正定的。t1,t2,,tkXt1,Xt2,,Xtk(γ^(titj),1i,jk)

两个公式之间区别的最简单情况

γ^(h)=n1t=1nh(xt+hx¯)(xtx¯)

γ^0(h)=(nh)1t=1nh(xt+hx¯)(xtx¯)

当长度为时出现;例如,。对于和,计算很简单x2x=(0,1)t1=tt2=t+1

γ^0=(14141414),

这是单数,而

γ^=(14181814)

它具有特征值和,因此它是正定的。3/81/8

对于发生类似的现象,其中是正定的,而 _0-当应用于时间 -退化为等级的矩阵(其条目在和之间交替)。x=(0,1,0,1)γ^γ^0ti=(1,2,3,4)11/41/4

(这里有一个模式:任何形式出现问题。)x(a,b,a,b,,a,b)

在大多数应用中,一系列观测值是如此之长,以至于对于大多数感兴趣的都远小于,和之间的差异并不重要。因此,在实践中,区别并不重要,并且从理论上讲,对正定性的需求会大大超过对无偏估计的任何期望。xthnn1(nh)1


1
我认为重要的是要注意,即使您将其除以nh,这两个估计量都是有偏估计量。
2013年

@Ran尽管您对这些估计量有偏见是正确的,但我不同意这是一个重要的问题:如上一段所述,很少有人会产生偏见。无偏估计量,使用(nh1)1,与 γ^ 要么 γ^0
ub

2
很好的答案+1。补充一点可能是有用的Vγ^0(h)=O(1/(nh)),而 Vγ^(h)=O(1/n),所以什么时候 h 接近 n,估算器 γ^0(h) 可能不稳定,而 γ^(h) 采样波动会一直很小 h。有关这一点的详细讨论,请参见例如Priestly(1981)“频谱分析和时间序列” p324
Colin T Bowers
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.