我有一个数据集,其中包含人们在几个月内一天中所走的步数。我将它们汇总在一起,以便每个人都有一个平均工作日和周末时间序列的步骤。下面是一个例子:
ID Weekday 00:00 00:30 01:00 ........ 23:00 23:30
A 1 20 30 23 154 256
A 0 15 67 121 35 101
B 1 78 21 46 78 26
B 0 55 301 22 121 451
我尝试通过将工作日和周末结合在一起(即每个人只有 1 个数据案例)使用 K-means、凝聚层次和动态时间扭曲进行聚类,它似乎显示了 2 组不同的人,一组通常更高水平高于其他组。
如何在考虑是工作日还是周末的同时进行聚类?因此,例如,可能有几个集群:一个具有高工作日活动和低周末活动,一个具有高 - 高,另一个具有低 - 低等?
我不确定这种情况下的术语是什么:多维时间序列?多元聚类?