我一直在玩一些数据,并且创建了一个相当大的相似度矩阵(一行的每一列值表示与该列对应的文档与该行对应的文档的相似程度),我正在尝试将此数据缩小到二维,以便我可以在散点图上对其进行可视化,其中每个点代表一个文档,两个文档越接近,它们在散点图上的距离就越近。我尝试使用 Sammon Mapping 来完成此操作,但问题是运行需要大量时间。有任何想法吗?
更快的多维缩放?
数据挖掘
数据集
可视化
2022-02-17 14:32:18
1个回答
您可以使用基于抽样的方法,通过组合从数据中提取的样本的部分结果,您可以获得实际结果的近似值。有几种基于采样的方法,但是您可以查看以下链接作为示例,这样您就可以理解我在说什么:
其它你可能感兴趣的问题