我是机器学习的初学者。我有一个大型项目数据集,每个项目在数据集中都有一组有限的最相似项目,我想创建集群,最好每个集群具有相同的大小,尽管这不是必需的。有人能指出我正确的方向吗?谢谢。
基于最相似项目列表的聚类算法?
数据挖掘
机器学习
数据挖掘
聚类
数据集
2022-02-16 06:27:24
3个回答
您可以使用 K-means 聚类来根据模式对数据进行聚类。
所有聚类算法,默认聚类最相似的项目。
如果您正在搜索特定的相似性(例如相似大小),您需要选择适当的距离度量(例如比较大小的度量)。
看看图聚类算法。
从每个项目到最相似的项目,您都有优势。
然后,您可以使用例如光谱聚类。