自相关时间的定义(有效样本量)


23

我在文献中为弱固定时间序列的自相关时间找到了两个定义:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

其中是滞后的自相关。 kρk=Cov[Xt,Xt+h]Var[Xt]k

自相关时间的一种应用是找到“有效样本量”:如果您对一个时间序列有观测值,并且知道它的自相关时间,那么您可以假装您拥有τnτ

neff=nτ

为了找到平均值,独立样本而不是相关样本。从数据中估计并非易事,但有几种方法可以做到这一点(请参阅Thompson 2010)。τnτ

没有绝对值的定义在文献中似乎更常见;但它承认的可能性。使用R和“ coda”包:τ 一个 < 1τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

“ coda”中的“ effectiveSize”函数使用的自相关时间的定义等于上述。还有一些其他R软件包可以计算有效样本大小或自相关时间,而我尝试过的所有软件包都给出了与之相符的结果:AR系数为负的AR(1)流程比相关的样本具有有效的样本时间序列。这似乎很奇怪。 τa

显然,这在自相关时间的定义中永远不会发生。τb

自相关时间的正确定义是什么?我对有效样本量的理解有问题吗?上面显示的结果似乎必须是错误的...发生了什么?neff>n


只是为了确保我没有被误解,这不应该是而不是吗?hCov(Xt,Xt+k)h
sachinruk

2
我对第二个定义。您能提供找到文献的地方吗?τb
哈里

Answers:


17

首先,国际海事组织将“有效样本量”的适当定义与一个非常具体的问题联系在一起。如果的均值和方差1分布,则经验均值 是的无偏估计量。但是其方差呢?对于变量,方差为。对于弱固定时间序列,的方差为 μ μ = 1X1,X2,μμñ-1 μ 1

μ^=1nk=1nXk
μn1μ^ÑÑEFF=ñ/τ一个ñ - 1个EFF ñEFFÑEFF=ñ/τ一个
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
近似值对于足够大的有效。如果我们定义,则弱平稳时间序列的经验均值方差约为,这是相同的方差就像我们有独立的样本一样。因此,如果我们要求经验平均值的方差,则是一个合适的定义。它可能不适用于其他目的。nneff=n/τaneff1neffneff=n/τa

在观察值之间具有负相关性的情况下,方差肯定有可能变得小于()。这是Monto Carlo积分中众所周知的方差减少技术:如果我们在变量之间引入负相关而不是相关0,则可以在不增加样本量的情况下减少方差。 ñ EFF > Ñn1neff>n


2
对于想了解更多有关在蒙特卡洛模拟中使用负相关的人,请尝试使用谷歌搜索“对立变量”。在此处此处的课程注释中有更多信息。
andrewtinka

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.