在时间序列中发现不可预测性或不确定性

数据挖掘 时间序列
2021-09-20 14:47:33

我有兴趣找到一个跟踪时间序列不可预测性的统计数据。为简单起见,假设时间序列中的每个值都是 1 或 0。例如,以下两个时间序列是完全可预测的 TS1:1 1 1 1 1 1 1 1 TS2:0 1 0 1 0 1 0 1 0 1 0 1

但是,以下时间序列并非那么可预测: TS3:1 1 0 1 0 0 1 0 0 0 0 0 1 1 0 1 1 1

我正在寻找一个给定时间序列的统计数据,它将返回一个介于 0 和 1 之间的数字,其中 0 表示该系列是完全可预测的,1 表示该系列完全不可预测。

我查看了一些熵度量,例如 Kolmogorov Complexity 和 Shannon entropy,但似乎都不符合我的要求。在 Kolmogorov 复杂度中,统计值根据时间序列的长度而变化(如“1 0 1 0 1”和“1 0 1 0”具有不同的复杂度,因此无法比较两个不同时间序列的可预测性观察次数)。在香农熵中,观察的顺序似乎并不重要。

关于什么是我的要求的良好统计数据的任何指示?

1个回答

由于您已经查看了 Kolmogorov-Smirnov 和香农熵测度,我想建议一些其他希望相关的选项。首先,你可以看看所谓的近似熵ApEn. 其他潜在的统计数据包括块熵T-复杂度( T-entropy ) 以及Tsallis 熵: http: //members.noa.gr/anastasi/papers/B29.pdf

除了上述潜在措施之外,我还建议查看基于贝叶斯推理的时间序列随机波动模型中的可用统计数据,该模型在R包中实现stochvol: http: //cran.r-project.org /web/packages/stochvol(请参阅详细的小插图)。此类不确定性统计数据包括总体波动水平 μ,坚持 ϕ波动率 σhttp ://simpsonm.public.iastate.edu/BlogPosts/btcvol/KastnerFruwhirthSchnatterASISstochvol.pdf 。使用随机波动率模型方法和软件包综合 示例stochvol可以在优秀的博客文章“比特币到底有多波动?”中找到。通过马特辛普森。