我有一个包含 5 个组的数据集及其与不同兴趣的关联。数据结构如下,包含2000 多个兴趣和5 个已知组:
Interest Group1 Group2 Group3 Group4 Group5
01. Sports 10% 40% 30% 80% 65%
02. Music 35% 60% 55% 10% 15%
03. Fashion 80% 10% 75% 5% 25%
.
.
.
1998. Movies 70% 20% 45% 50% 65%
1999. Books 50% 70% 35% 65% 95%
2000. Art 90% 50% 25% 15% 30%
我想了解什么是确定哪些群体彼此最接近以及哪些群体在兴趣方面彼此最不同的最佳方法。
我倾向于聚类分析,但是我的数据结构让我失望。
任何建议将不胜感激。