时间序列聚类和时间序列分割之间的区别

数据挖掘 数据挖掘 聚类 时间序列
2021-10-09 13:23:22

在时间序列数据挖掘的背景下,我读过时间序列分割和时间序列聚类,但我无法区分两者。如果它们不同,这些方法如何相互关联?

好吧,根据我的理解(如果我错了,请纠正我),分割被认为是聚类阶段的预处理步骤。我的意思是分段步骤主要用于将您的时间序列数据划分为段,比方说划分为状态。之后,可以应用传统的聚类算法将这些段分组为簇(相似的段属于同一个簇)。

例如,假设分割过程将给定的时间序列表示为以下段:(S1、S2、S3、S4、S5、S6)。然后在应用分割过程之后,应用传统的聚类方法对提取的片段进行聚类。所以我们最终可能会得到这样的结果:如果 k = 3: 那么 K1 {S1, S5}, K2 {S3, S6}, K3 {S2, S4}

如果我弄错了,请纠正我,如果您有任何问题,请提供链接以进行更多说明。

1个回答

实际上没有固定的术语,这两个术语有时含义相同,有时不同。我建议您自己遵循以下术语,然后您可以根据此区分方法:

  • 时间序列分割意味着将单个时间序列划分为相似的段,即在单个时间序列内进行聚类(例如,我有一个视频,其中有人正在看书一段时间,然后开始走路,然后开始骑自行车。现在我想分割这三个动作)。

建议:状态空间重建、移动自相关、移动DTW、傅里叶分析、可见性图或任何其他可以测量时间序列与其自身相似度的方法。

  • 时间序列聚类(或this)意味着在时间序列数据集中找到相似的时间序列(例如,我有 10 个脑信号,5 个来自健康受试者,5 个来自患者,但不知道谁是患者,谁是健康的。现在我想将此数据集聚类为两个聚类)

建议:使用例如DTW建立时间序列之间的相似性矩阵,然后应用光谱聚类(只是即兴创作。如果您搜索文献应该有更成熟的解决方案)

希望它有所帮助:)