我正在广泛使用金融时间序列模型,主要是 AR(I)MA 和 Kalman。
我一直面临的一个问题是采样频率。最初,我在考虑是否可以从基础流程中更频繁地采样,我应该尽可能频繁地采样,这样我将拥有更多的样本,因此我的模型参数的变化会更小。
实际上,这个想法并没有证明是好的。发生的情况是,如果底层过程没有表现出足够的变化,那么增加采样频率实际上意味着获得大量重复(相同)的值。并且在这些值上建立模型会导致模型系数非常小,并且不能很好地预测未来(当然,“好”的定义是主观的,增加频率需要预测未来更多的样本步骤在较低的频率设置中实现相同的时间步长)。该模型学习了它遇到的最多的东西——一条平线。
我想做一种自适应采样方法,即在有变化时更频繁地采样,而在没有变化时采样频率更低。然而,这并不容易。首先,不清楚我这样做会引入什么样的偏差(并且会根据我触发样本/跳过的方式而有所不同)。其次,像 ARIMA 这样的时间序列模型不太适合不均匀的样本步骤。
有没有解决这个问题的好方法?这也让我想知道,如果模型受到采样频率的如此显着影响(尤其是当时间步长越来越小时),如何实现连续时间模型和离散时间模型之间的无缝过渡?任何指向外部资源的指针也将不胜感激。
谢谢