关于形状位置的时间序列聚类的合适距离度量

机器算法验证 机器学习 时间序列 聚类 距离
2022-04-05 22:34:19

我正在对时间序列进行聚类(每个时间序列都有一天 = 24 小时的信息)。出于聚类目的,考虑时间序列形状与基线不同的时间段对我来说很重要所以,我正在寻找一个合适的距离度量。

例如,让我们考虑这 4 个时间序列,我想将它们分成两组。

在此处输入图像描述

显然,对于 k=2,时间序列 1 和 2 更相似并被视为一个集群,而时间序列 3 和 4 在另一个集群内。但是,当我使用常用​​的欧几里得距离度量时,所有时间序列之间的计算距离是相同的,因为它考虑了点之间的一对一映射,并且没有考虑这些形状的距离。我也尝试过动态时间规整 (DTW),因为它的应用程序与我在这里想要做的匹配,但是与欧几里德距离获得的结果相比,我在更大规模数据集中的聚类结果更没有希望(我使用的是默认的MATLAB DTW 的命令行,所以我不确定我是否有效地利用它)。

我的问题是,在这种情况下,哪种距离度量更适合捕捉相似性。

1个回答

次要的一点,DTW 不是一个度量,只是一个度量。

您需要的措施是受约束的DTW(或cDTW),

有了足够的数据,您就可以了解约束,但很明显它应该是时间序列长度的 1/3 左右。

本教程将告诉你所有你需要知道的 http://www.cs.unm.edu/~mueen/DTW.pdf

埃蒙