如何根据日常数据重新训练 K-Modes 模型?

数据挖掘 聚类 机器学习模型 k-均值 分类数据
2022-02-15 19:40:16

我读过重新训练模型在很大程度上取决于您要实现的目标。我意识到也许我需要每天重新训练我的模型,并且在一段时间后我必须从头开始再次训练模型。那没问题。问题是,如果我要重新训练 K-Modes 模型,我需要保存以前的质心。我认为这也不是问题。看到这里K-Modes 的实现,参数init可以是HuangCao在 sklearn 的 K-Means 实现中(见这里),我们可以传递一个ndarrayshape (n_clusters, n_features)我在 K-Modes 实现中找不到此功能。所以我的具体问题是:

  1. 保存以前的质心是否足以重新训练模型?
  2. 有没有办法在我提到的 K-Modes 实现中传递以前的质心?如果没有,我应该实现自己的 K-Modes 吗?
1个回答

有专门的/学习pypi包。它被称为here's there repo。它包含实现尽管在幕后,没有增量的东西发生,因为您需要一次传递的所有数据(在此处阅读更多信息)。incrementalonlineCremeKMeans Lloyd's algoritm