集群随时间的演变

数据挖掘 机器学习 时间序列 聚类 k-均值 无监督学习
2021-10-06 00:13:09

我有一个带有客户 ID 的交易数据数据集,我想使用聚类分析将数据集分组。我有兴趣跟踪每个集群随时间的演变,但由于客户的行为非常不同(大约 50% 的时间客户将在一周后更改集群),我想知道什么是统计上合理的方法。每周训练一个聚类算法并回顾每个细分的每周演变是一个好主意吗?

3个回答

你可以试试

  1. 动态模式分解。
  2. 动态时间扭曲。在Towards data science 博客上找到了一个很好的资源

在时间序列聚类方面,这两种方法已被证明比 PCA 更好。

快乐编码💻

集群一次。

研究集群并细化它们以定义类。

然后将点分类到这些类。

定期运行集群(比如每个月)。使用肘部方法来决定最佳集群数量(对系统随时间变化的这一方面持开放态度)。定义/标记每个集群代表什么 - 每个集群的质心代表集群内囚犯的平均行为。