使用聚类作为细分

机器算法验证 聚类
2022-03-28 06:08:22

我对一群客户进行了聚类分析。我使用了如下变量:

  • 寿命
  • 花费金额
  • 等等

现在我想使用这些集群(“小买家”、“品牌 A 的忠实粉丝”……)进行细分。

问题:未来的客户会出现,但我不能每天都重新运行一次聚类分析,所以我需要将新客户分配到当前的聚类中。

建议:我可以将未来的客户分配到当前集群最近的质心。

如果新客户的分布与当前客户的分布不同,则将新客户分配到尚未为其构建的集群。因此,聚类将恶化。

问题:如何监控聚类/分割质量的演变?

我正在考虑监控 R-Squared(确定系数)的演变,因为它是我用来选择实际聚类的指标,但我不确定它是否是最佳实践。

1个回答

你看过流聚类算法吗?

已经有一些关于不断变化的数据集以及概念漂移等相关挑战的研究。

此外,摆脱 k-means 术语的思考;更现代的聚类算法没有可以仅用质心概括的球形聚类。

将集群视为“质心”会限制您的思维方式。