我在 R 中使用 Keras 来预测金融时间序列。标准化价格很容易,只需计算收益或对数收益,通常就足够了。我想使用高盛金融状况指数和 MSCI 世界指数来预测其他证券,并且我想使用水平及其回报或一阶差异。我认为使用 minmax 或 z-score 归一化是不合适的,因为系列分布会改变。那么,问题是如何标准化非平稳时间序列数据?
金融时间序列数据标准化
数据挖掘
喀拉斯
r
时间序列
正常化
2021-09-21 06:00:50
1个回答
正如您已经猜到的那样,Z-score 归一化不能很好地处理非平稳时间序列,因为时间序列的均值和标准差随时间而变化。
Min-max 和静态数据中另一种常用的归一化,十进制标度归一化取决于知道时间序列的最大值。
非平稳时间序列数据标准化最常用的方法是滑动窗口方法(J. Lin 和 E. Keogh,2004,Finding or not found rules in time series)。简而言之:
这种方法的基本思想是,它不考虑完整的时间序列进行归一化,而是将数据划分为长度为 ω 的滑动窗口,从中提取统计特性,只考虑 ω 连续时间序列值的一小部分(H. Li 和S. Lee,2009,使用有效的窗口滑动技术挖掘数据流上的频繁项集,Expert Syst. Appl.,v. 36,n. 2,p. 1466-1477。JC Hull,2005),并规范化每个窗口,仅考虑这些统计属性。这种方法背后的基本原理是决策通常基于最近的数据。(...) 滑动窗口技术具有始终在所需范围内归一化数据的优点。但是,它有一个缺点,即假设时间序列波动率是均匀的,这在许多现象中是不正确的
另一个更高级且使用较少的(到目前为止)是自适应归一化
可以分为三个阶段:(i)将非平稳时间序列转换为平稳序列,从而创建一系列不相交的滑动窗口(不重叠);(ii) 异常值去除;(iii) 数据标准化本身。
检查自适应规范化及其所有参考的链接,那里有相关信息。
其它你可能感兴趣的问题