如何为聚类执行特征选择?

数据挖掘 相关性 降维
2022-03-05 09:31:51

我是数据科学的新手并正在尝试学习聚类?我必须根据他们的购买习惯将给定的数据集划分为不同的集群到客户集群中吗?如何选择对聚类很重要的特征?

在此处输入图像描述

Heirarchy_1、Herarchy_2 等描述了产品。 在此处输入图像描述

1个回答

上表中描述的数据是针对采购的。但是,您想要对用户进行细分。因此,首先要导出用户数据的数据集。

作为第一种方法,我建议您创建一个表,其中每个客户 ID 有一行,您可以在其中了解客户购买了每个可能的层次结构值的产品数量(例如,客户 ID:312425,购买的餐具产品:5 ,炊具产品购买:10,浴秤-手动产品购买:0),然后对其进行聚类。