如何随时间聚集?

数据挖掘 机器学习 数据科学模型
2022-02-11 22:16:38

我有一个问题,我有一组对象(为了便于解释,比如说智能手机)。对于每部手机,我们在 3 个月(例如)期间收集了几个特征特征(例如通话时长、拨打、接听电话的数量等)。现在基于这些收集的数据集,我们需要将手机分组。情况类似于下图: 在此处输入图像描述

我的第一个想法是遵循我们在处理图像时所做的事情。从图像矩阵中制作一个向量,然后进行聚类。在我的例子中,我们通过保持时间序列来制作向量。因此,对于每个手机,如果数据集的大小为 mxp 并且有 n 个这样的手机,我们构建一个大小为 nx (mxp) 的数据集。但是,我无法确定这种方法是否存在任何问题,或者它是否会达到我们想要的效果。

我正在寻找一些想法。任何建议将不胜感激。

谢谢并恭祝安康。

1个回答

如果您认为集群会随着时间而变化,那么可以将问题框定为时间序列集群。几乎所有的聚类算法都有时间序列版本(例如,k-means 和分层)。

如果假设集群随着时间的推移是相同的,那么可以忽略时间并且可以应用标准集群。