我正在对时间序列进行聚类(每个时间序列都有一天 = 24 小时的信息)。出于聚类目的,考虑时间序列形状与基线不同的时间段对我来说很重要。所以,我正在寻找一个合适的距离度量。
例如,让我们考虑这 4 个时间序列,我想将它们分成两组。
显然,对于 k=2,时间序列 1 和 2 更相似并被视为一个集群,而时间序列 3 和 4 在另一个集群内。但是,当我使用常用的欧几里得距离度量时,所有时间序列之间的计算距离是相同的,因为它考虑了点之间的一对一映射,并且没有考虑这些形状的距离。我也尝试过动态时间规整 (DTW),因为它的应用程序与我在这里想要做的匹配,但是与欧几里德距离获得的结果相比,我在更大规模数据集中的聚类结果更没有希望(我使用的是默认的MATLAB DTW 的命令行,所以我不确定我是否有效地利用它)。
我的问题是,在这种情况下,哪种距离度量更适合捕捉相似性。