假设我有这些元素:
a = [1, 6, 3, 4, 10, 32, 2, 54]
b = [20, 5, 14, 25, 18, 1]
c = [54, 3, 6, 12, 41, 1, 9]
d = [3, 4, 1]
e = [19, 20, 25, 5]
每个都由一个 id 列表标识(实际上代表一个字符串,但为了简单起见,我们将使用数字)。
我如何通过找到那些具有最多共同元素的人来对它们进行聚类?
例如:
a
andd
有 3 个共同元素
b
和e
3 个共同元素
a
和c
4 个共同元素
所以我想要 ar ( a
, c
, d
) 和 ( b
, e
) 的集群。
我想在 Python 脚本中获得它