如何比较两个距离矩阵?

机器算法验证 矩阵 距离 相似之处
2022-03-06 11:20:24

假设我有两个用于同一组项目的距离矩阵。距离矩阵是指一个方阵,其第 (i,j) 个条目保存第 i 个和第 j 个项之间的距离(根据余弦相似度)。第 i 个和第 j 个项目是两个矩阵中的相同项目。当我们从两个不同的来源收集有关一组项目的信息时,可能会发生这种情况。

我想要做的是比较这两个距离矩阵。就项目之间的距离关系而言,它们是否相似。

一个想法是找到两个矩阵的元素之间的相关性(只有上三角元素,因为它们是对称矩阵)。这可以通过 Mantel 的测试来完成。

想到的另一件事是从这些距离矩阵中构建聚类并比较生成的两个聚类。但这是否提供了有关 Mantel 测试的任何其他信息?

我们可以使用其他度量来理解这两个距离矩阵之间的相似性还是以上两种方法就足够了?

为了使事情具体化,这些项目是文档。一组包含用英语编写的维基百科文档,另一组包含用另一种语言(例如德语)编写的相同文档。文档被编码为 tf*idf 向量,并且它们的相似度值使用余弦相似度来测量。所以一个距离矩阵保存英文文档的相似性,另一个保存德语文档的相似性。

0个回答
没有发现任何回复~