我想降低高阶系统的维数,并在最好的二维或一维场上捕获大部分协方差。我知道这可以通过主成分分析来完成,并且我在许多场景中都使用过 PCA。但是,我从来没有将它与布尔数据类型一起使用,我想知道用这个集合做 PCA 是否有意义。例如,假设我有定性或描述性指标,如果该指标对该维度有效,则分配“1”,否则分配“0”(二进制数据)。例如,假设您正在尝试比较白雪公主中的七个小矮人。我们有:
Doc、Dopey、Bashful、Grumpy、Sneezy、Sleepy 和 Happy,你想根据质量来排列它们,并且这样做是:
例如,Bashful 是乳糖不耐症,不在 A 荣誉榜上。这是一个纯粹的假设矩阵,我的真实矩阵将有更多的描述性列。我的问题是,在这个矩阵上做 PCA 作为寻找个体之间相似性的手段是否仍然合适?