有人建议我在这个小组中写关于我关于建模分类数据库的问题。我有一个客户数据集,这是一个调查结果。我有1595个obs。大约 200 列(200 列,因为大多数情况下问题是多项选择,我们不得不将其分成列)。大多数变量是分类的或二元的。我根本没有连续变量。我的任务是做客户细分、聚类。没有初始假设,尽管我也有问卷,所以可以在逻辑上分离重要问题。
我在建模方面面临几个问题
- 我需要验证我使用的变量的选择
- 我正在尝试寻找关联、成对关联和趋势,因为我没有初始假设谁可以成为我的细分市场
- 聚类模型不适用于分类变量和我尝试过的那些,例如 kmods,忽略关联、相关性并返回给我不清楚的图片。
你能建议如何接近,或者从哪里开始。我是数据分析方面的新手,我需要一些提示才能继续进行分析,我将很感激能得到一些至少是高水平的指导。
提前致谢!