我在文献中发现了弱平稳时间序列的自相关时间的两个定义:
其中是滞后处的自相关。
自相关时间的一种应用是找到“有效样本量”:如果你有一个时间序列的,那么你可以假设你有
独立样本,而不是相关样本,以求均值。从数据中估计并非易事,但有几种方法可以做到这一点(参见Thompson 2010)。
没有绝对值的定义在文献中似乎更常见;但它承认的可能性。使用 R 和“尾声”包:
require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000) # white noise
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000) # AR(1)
effectiveSize(ts.uncorr) # Sanity check
# result should be close to 10000
effectiveSize(ts.corr)
# result is in the neighborhood of 30000... ???
"coda" 中的 "effectiveSize" 函数使用与等价的自相关时间的定义。还有一些其他的 R 包可以计算有效样本大小或自相关时间,我尝试过的所有包都给出了与此一致的结果:具有负 AR 系数的 AR(1) 过程具有比相关的更有效的样本时间序列。这似乎很奇怪。
定义中永远不会发生。
自相关时间的正确定义是什么?我对有效样本量的理解有问题吗?上面显示的结果似乎一定是错误的......这是怎么回事?