我对一群客户进行了聚类分析。我使用了如下变量:
- 寿命
- 花费金额
- 等等
现在我想使用这些集群(“小买家”、“品牌 A 的忠实粉丝”……)进行细分。
问题:未来的客户会出现,但我不能每天都重新运行一次聚类分析,所以我需要将新客户分配到当前的聚类中。
建议:我可以将未来的客户分配到当前集群最近的质心。
如果新客户的分布与当前客户的分布不同,则将新客户分配到尚未为其构建的集群。因此,聚类将恶化。
问题:如何监控聚类/分割质量的演变?
我正在考虑监控 R-Squared(确定系数)的演变,因为它是我用来选择实际聚类的指标,但我不确定它是否是最佳实践。