当我相对于未简化的图简化图数据结构时,如何判断我丢失了多少信息?

数据挖掘 主成分分析 图表
2022-03-01 22:00:21

我有以下问题:我有一些数据(我不能在这里发布,但它们是具有 XYZ 坐标的点的形式),我可以将它们表示为图形的集合,即,其中每个节点都有一组关联的特征,例如节点有特征向量Q={G1,G2...Gt}uiFi并且特征在图形之间发生变化(但图形结构不会)。使用这种方法生成的图表很大。因此,我决定通过截断一些节点和边来使图形更小。我想计算当我相对于未简化的图表或原始数据简化图表时丢失了多少信息。我想得到类似“这张图解释了数据中 77% 的方差”和截断图“这张图解释了数据中 55% 的方差”之类的东西。

那么问题就来了:当我简化图形数据结构时,如何判断我丢失了多少信息。

编辑:也可以用加权边缘替换特征向量。我认为它可以使问题更容易解决。

2个回答

图表比较可能很棘手。

一种选择是采用信息论方法,例如“一种信息论的、全方位的网络比较方法

你将如何简化图表?知道这一点很重要,因为最终你将不得不比较图表。您可以做的一件事是测量图形的密度。其高级粗略的想法。你可以上网看看。就图论而言,方差就是密度本身。https://www.quora.com/What-is-graph-density