数据挖掘 - 按相似度分组 - 吾爱随笔录

数据挖掘聚类

2022-03-08 04:50:06

我想找到一种方法/算法，通过他们对是/否问题的回答相似性将人们分成四组。

因此，一组中的每一对人都会对大部分问题给出相同的答案——（大部分）比其他三组的人要大。

将不胜感激任何指向正确方向的指针。

1个回答

我将从简单的选项开始：将每个人表示为一个布尔向量，其中每个位置都表示特定问题的答案（长度是问题的总数）。然后您可以应用任何标准聚类算法，例如K-means（层次聚类可能也适用于这样的数据）。

其它你可能感兴趣的问题