具有分类变量的层次聚类

机器算法验证 分类数据 层次聚类
2022-03-22 10:04:16

分类变量可以用于层次聚类吗?我听说只使用连续变量,但看到人们讨论分类变量可能/可能不会被使用。任何人都可以提供见解吗?

1个回答

是的,当然,分类数据经常是聚类分析的主题,尤其是分层数据。对于二元变量(包括作为分类变量的垃圾的虚拟集)存在许多邻近度度量;还有熵测度。案例集群将是属性的频繁组合,并且各种度量为频率推算提供了特定的香料。聚类分类数据的一个问题是解决方案的稳定性。而这个最近的问题提出了变量相关性的问题。