我想找到一种方法/算法,通过他们对是/否问题的回答相似性将人们分成四组。
因此,一组中的每一对人都会对大部分问题给出相同的答案——(大部分)比其他三组的人要大。
将不胜感激任何指向正确方向的指针。
我将从简单的选项开始:将每个人表示为一个布尔向量,其中每个位置都表示特定问题的答案(长度是问题的总数)。然后您可以应用任何标准聚类算法,例如K-means(层次聚类可能也适用于这样的数据)。