聚类和时间序列

机器算法验证 时间序列 聚类 多元分析
2022-01-30 06:27:44

我有一个随时间变化的多元数据集。我已经提取(并标准化)了一些特征,并使用k-means在整个数据集范围内生成集群。

现在我想看看集群是否会随着时间的推移发生显着变化。那么,向后工作,从而将数据集减少 x 个月,我可以看到某些集群的显着减少吗?

我认为,这可能属于时间序列聚类的范畴。我希望避免使方法复杂化,因为集群目前是有意义的并且方法相对简单。

有人可以告诉我如何去做吗?

我的直觉是将数据集减少 x 个月,然后对数据进行聚类(使用 k-means)进行比较但是,我可能在这里打破了规则,将一个复杂的问题过于简单化了。

1个回答

时间序列聚类要求样本量保持不变,但特征随时间变化,否则意义不大。不过,在这个问题中,从描述样本量中推断会随着时间的推移而增加。在这种情况下,要查看significant reduction on certain clusters,应该使用固定的样本大小。然后从初始时间段中选择固定样本,并查看它们的集群大小和成员资格如何随时间变化。

象征性地,假设您有 3 个数据集(特征矩阵)随着时间的推移:

Xt0Xt1Xt2

和相应的聚类C0,C1,C2, 在哪里C本质上是实例和集群成员表。要判断聚类如何变化,请在t0, 这样X0Xt0. 跟踪方式X0的成员资格和不同聚类上的聚类大小C0,C1,C2变化。如果在不同的聚类上有“减少”(显着变化),这将是一个好主意,因为X0随着时间的推移具有代表性。