比较随时间变化的聚类

数据挖掘 聚类
2022-03-02 13:36:11

我最近对一些混合数据进行了 k-prototypes R 例程。

特别是,这些数据是与某种公共卫生干预有关的健康数据,具有健康评分的分类变量和数字人口统计数据,例如年龄

效用分数是在不同的时间点测量的,第 1 周有一个样本,第 10 周有一个样本。

目前,我只对其中一个样本进行了聚类分析。但是,我想知道在第 1 周和第 10 周之间是否有公认的对集群进行推断的例程。

所有反馈将不胜感激。我认识到这不是纵向聚类,而是比较两种不同的聚类状态。

谢谢

1个回答

有很多选择。一种选择可能是在第一个时间点查找集群并在第二个时间点定义更改“度量”。一个可能的变化指标是数据点在第二个时间点是否属于同一个集群。

您提到了 k-means 的一种变体。由于 k-means 是一种迭代算法,因此这种集群重新分配是在每个训练步骤之间发生的。此方法的不同之处在于您允许数据​​点在训练步骤之间移动并测量有多少集群分配发生变化。