与多维聚类的相关性

数据挖掘 Python 聚类 数据
2022-03-12 08:51:11

我有一个具有多个特征的数据框,我在其中选择 3 个特征进行聚类。前任。

Col1 | Col2 | Col3 
-------------------
A    |  1  |   i
B    |  1  |   j
C    |  2  |   k
D    |  3  |   j

我正在尝试进行聚类,以便如果任何两列中有匹配的值,它将将该行添加到同一个集群中,以获取集群中值内的所有匹配项。

因此,从这张表中,我对集群的预期输出将是:

A    |  1  |   i
B    |  1  |   j
D    |  3  |   j

有没有可以用来实现这种类型聚类的聚类算法?

1个回答

这不是聚类,因为行没有被分组在一起。

这是一个过滤问题,其中保留行的阈值基于每列中的频率。