R中的双向聚类

机器算法验证 r 聚类 多元分析
2022-03-26 15:11:24

我想知道如何实现双向聚类,如R 中的Statistica 文档中所述。在这方面的任何帮助将不胜感激。谢谢

1个回答

一般来说,您应该始终通过查看相关的 CRAN TAsk Views 找到有用的指针,在这种情况下是处理Cluster包的视图,或者可能是 Quick-R

我不清楚您提供的链接是否引用了标准聚类技术n(个人)由k(变量)我们对生成的热图显示施加约束的度量矩阵,或双模式聚类或双聚类

在第一种方法中,我们可以,例如,

  1. 计算个体之间(不)相似性或变量之间相关性的度量,并显示结果n×n或者k×k矩阵,其中行和列通过某种分区或排序技术重新排列 - 这有助于突出关联矩阵中可能的子结构,您将在此相关问题中找到更多信息;
  2. 计算在同一个人身上观察到的两个数据块之间的相关性,并按照外部排序技术(例如,层次聚类)对相关性模式进行重新排序——这相当于显示了按行列重新排序的观察到的统计数据的热图。

正如在较早的响应中所提出的,后者在mixOmics包的cim()函数中很容易获得。从在线帮助中,我们可以得到类似的结果:

在此处输入图像描述

请注意,这只是方便地显示关联汇总度量的两步过程:行(个体或变量)和列(个体或变量)的聚类是分开完成的。

在我倾向于支持的第二种方法(双聚类)中,我只知道一个 R 包biclust,它极大地启发了生物信息学的研究。在较早的线程中也给出了一些指针(但心理计量学文献中甚至有一些论文。)在这种情况下,我们需要在聚类过程中设置一些约束,因为我们希望同时对个体变量进行聚类

同样,您可以将生成的结构显示为热图(请参阅 参考资料help(heatmapBC)),如下所示

在此处输入图像描述