我在文献中为弱固定时间序列的自相关时间找到了两个定义:
其中是滞后的自相关。 k
自相关时间的一种应用是找到“有效样本量”:如果您对一个时间序列有观测值,并且知道它的自相关时间,那么您可以假装您拥有τ
为了找到平均值,独立样本而不是相关样本。从数据中估计并非易事,但有几种方法可以做到这一点(请参阅Thompson 2010)。τ
没有绝对值的定义在文献中似乎更常见;但它承认的可能性。使用R和“ coda”包:τ 一个 < 1
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
“ coda”中的“ effectiveSize”函数使用的自相关时间的定义等于上述。还有一些其他R软件包可以计算有效样本大小或自相关时间,而我尝试过的所有软件包都给出了与之相符的结果:AR系数为负的AR(1)流程比相关的样本具有更有效的样本时间序列。这似乎很奇怪。
显然,这在自相关时间的定义中永远不会发生。
自相关时间的正确定义是什么?我对有效样本量的理解有问题吗?上面显示的结果似乎必须是错误的...发生了什么?