我有代表人类行为某些方面的数据。我想将它(无监督)聚类到某种行为档案中。现在,我的一些变量是分类的(有 2 个或更多类别),有些是连续的(大多数是百分比)。一些变量甚至更复杂,其中一类具有进一步的连续性,而另一类则没有这样的附加数据。
我的问题是关于如何对这些数据进行分类。处理它的(常见的?)方法是什么?
我不需要代码或任何东西,而是需要一些参考资料或指导来帮助我进一步了解如何应对这一挑战。
如果您知道R
有助于此类分析的功能,那将是很好的,但这不是必需的。
谢谢。
我有代表人类行为某些方面的数据。我想将它(无监督)聚类到某种行为档案中。现在,我的一些变量是分类的(有 2 个或更多类别),有些是连续的(大多数是百分比)。一些变量甚至更复杂,其中一类具有进一步的连续性,而另一类则没有这样的附加数据。
我的问题是关于如何对这些数据进行分类。处理它的(常见的?)方法是什么?
我不需要代码或任何东西,而是需要一些参考资料或指导来帮助我进一步了解如何应对这一挑战。
如果您知道R
有助于此类分析的功能,那将是很好的,但这不是必需的。
谢谢。
有关R 包,请参阅https://cran.r-project.org/web/packages/ClustOfVarClustOfVar
。它似乎为变量类型的混合实现了一些可用的最佳聚类方法。