我想计算一些固定时间序列数据的波动性或噪声度量。这可以是单个时间序列的度量,也可以是比较多个时间序列的相对度量。假设已经进行了 Dickey-Fuller 检验,并且所有时间序列都没有单位根。
测量噪声/波动性的此类指标有哪些示例?我考虑了简单的“变异系数”,即 SD/均值。但是,我想知道是否有其他方法可以衡量这一点。如果有帮助,我会使用 R。
我知道这是一个模糊的要求,我很抱歉。我非常感谢任何有关该主题的建议或资料。
我想计算一些固定时间序列数据的波动性或噪声度量。这可以是单个时间序列的度量,也可以是比较多个时间序列的相对度量。假设已经进行了 Dickey-Fuller 检验,并且所有时间序列都没有单位根。
测量噪声/波动性的此类指标有哪些示例?我考虑了简单的“变异系数”,即 SD/均值。但是,我想知道是否有其他方法可以衡量这一点。如果有帮助,我会使用 R。
我知道这是一个模糊的要求,我很抱歉。我非常感谢任何有关该主题的建议或资料。
如前所述,基于 L2 范数的典型统计方法包括标准偏差以及变异系数(对于非负度量,它产生尺度不变的度量)以及离散指数(方差与平均值的比率)。如果数据是财务数据,那么也可以计算“上行”和/或“下行”风险度量,也就是高于或低于目标的半偏差,如这些 wiki 文章 ( https://en.wikipedia ) 中所述.org/wiki/Downside_risk或https://en.wikipedia.org/wiki/Upside_risk)。
基于 L1 范数的测量是可能的,例如,MAD 或平均绝对偏差和 MADM,中值与中位数的绝对偏差。其他非参数估计包括四分位数范围、十分位数范围,以及 Rousseeuw 和 Croux 在他们的论文中讨论的指标,中值绝对偏差的替代方案(此处为无限制副本 ... http://web.ipac.caltech.edu/工作人员/fmasci/home/astro_refs/BetterThanMAD.pdf)。
信息论方法包括熵测量(https://en.wikipedia.org/wiki/Entropy_(information_theory)),例如 Theil's U或信息多样性指数的许多变体(例如,https://en.wikipedia .org/wiki/Generalized_entropy_index)。
Hyndman 的论点是他的MASE度量对于时间序列数据是最优的。MASE 是一个归一化的损失函数。创建训练和测试数据后,测试数据残差被归一化或除以训练数据中的平均误差。如果 MASE<1,则建议的模型平均而言是一个改进,超过了前一步的随机游走预测。
参见他的论文,Hyndman 和 Koehler,另一个看预测准确度的措施,国际预测杂志,22(4):679-688,2006,https ://robjhyndman.com/papers/mase.pdf,p 。3