如何找到相似的时间序列?
数据挖掘
时间序列
相似
余弦距离
2021-10-05 14:51:21
1个回答
由于时间序列是年度的,因此每个时间序列的数据点是有限的,而且相距甚远(这些值相隔 1 年)。所以我不会对您的数据使用动态时间包装。
如果您对比较模式感兴趣,一个非常简单的方法是 Pearson 相关性。请记住,这不会比较实际值而是模式(即,如果这些值与年份有类似的波动,因此例如时间序列 [1 2 3 4] 与 [5 6 7 8] 的相关性高于与 [1 1 2 2])
如果您对值和模式都感兴趣,我会使用基于距离的度量:欧几里得距离、曼哈顿距离等。我相信您会发现这篇文章很有趣,其中解释了相似性的数学背景。此外,可以在这篇博文中找到 Python 中几个距离度量的 Python 实现(包括余弦相似度)。
其它你可能感兴趣的问题