工作日周末时间序列数据的聚类

数据挖掘 时间序列 聚类 k-均值
2022-02-10 21:59:08

我有一个数据集,其中包含人们在几个月内一天中所走的步数。我将它们汇总在一起,以便每个人都有一个平均工作日和周末时间序列的步骤。下面是一个例子:

ID Weekday 00:00 00:30 01:00 ........ 23:00 23:30
A    1       20    30    23             154  256
A    0       15    67    121            35   101
B    1       78    21    46             78   26
B    0       55    301   22             121  451

我尝试通过将工作日和周末结合在一起(即每个人只有 1 个数据案例)使用 K-means、凝聚层次和动态时间扭曲进行聚类,它似乎显示了 2 组不同的人,一组通常更高水平高于其他组。

如何在考虑是工作日还是周末的同时进行聚类?因此,例如,可能有几个集群:一个具有高工作日活动和低周末活动,一个具有高 - 高,另一个具有低 - 低等?

我不确定这种情况下的术语是什么:多维时间序列?多元聚类?

1个回答

由于您不进行任何对齐,因此您可以简单地连接两个向量。

然后,KMeans 将最小化工作日和周末的差异。