我收集了大量的时间序列——在 1 年的时间里,在各个不同地点每 15 分钟进行一次测量(一天 96 次测量)。
我将每个时间序列分解为 365 个单独的较小时间序列,一年中的每一天都有 1 个。查看这些时间序列,一天肯定有许多不同的形状。有些看起来是正弦曲线,有些是恒定的,有些看起来像随机随机过程,有些看起来像抛物线,有些看起来像 U 形。
我想做的是使用一种可以找到这些常见形状的算法。我考虑过聚类,并使用聚类质心来定义常见形状,但想与社区核实这是否正确。到目前为止,我已经将动态时间扭曲视为一个指标,但该指标似乎需要大量计算。我也发现
http://mox.polimi.it/it/progetti/pubblicazioni/quaderni/13-2008.pdf来自 SE。
我还看到了是否可以根据曲线形状进行时间序列聚类?但这个问题是从 2010 年开始的,可能已经过时了。
我的另一个想法是对格式如下的矩阵进行特征分解:
矩阵是在第天观察到的所有时间序列的矩阵。的每一行都是一个长度为 96 的时间序列。然后,我会做 365 个特征分解,并将特征向量用作常见形状。这听起来合理吗?
谢谢!