两个网络图之间的显着差异

机器算法验证 r 网络
2022-04-01 06:34:39

我正在花时间学习如何分析网络,并想测试两个网络之间是否存在差异。由于我是 R 和一般网络的新手,我希望在如何比较和分析网络图方面获得一些帮助。

简单地说,我的数据集将包含两个地理单位之间的流量信息(想想人口普查迁移数据)。我想测试流量是否随时间而变化。由于我刚刚开始,我什至不确定我是否正确地表达了我的问题。

我之前在 R 中创建了一些基本图表,并在一个孤立的图表上生成了一些非常基本的“汇总统计”,所以我了解如何启动和运行,但我不确定从这里去哪里。

2个回答

我同意 Srikant 的观点,你需要为你的流程建模。你提到你已经在 R 中创建了一些网络,你假设什么模型?

我解决这个问题的方法是形成一个数学模型,比如 ODE 模型。例如,

dXi(t)dt=λXi1(t)μXi+1(t)

其中取决于地理单位的人口。由于您对时间差异感兴趣,因此您的参数也可能取决于Xiiλt

您可以同时拟合两个模型并确定费率是否不同。

您的问题并不容易,我认为没有简单的解决方案。

我不确定我能否提供完整的答案,但这是我将如何开始。

第 1 步:为通过网络的流的数据生成过程建模

例如,您可能希望将网络中从一个点到另一点的流量建模为泊松分布泊位分布用于模拟系统中随时间的到达,因此可以很好地用于网络流。根据网络复杂性和您的需求,您可以对每条路径进行建模,使每条路径的到达率不同或相同(请参阅泊松分布的参数。)λ

第 2 步:确定一个测试策略,让您确定您的空模型的证据强度。

这一步的挑战是双重的。首先,您必须定义当您说网络在不同时间在网络中流动是相同的时您的意思。你说的是吞吐量吗?还是您在谈论每条路径上的流量?

第二个挑战是,一旦你解决了上述问题,你需要找到一种方法来检验你的零假设。

例如:假设您要检查每条路径上的流是否相同,并且您正在通过单个参数对网络的路径流进行建模(即,对于所有路径都是相同的)。因此,您的零假设将假设不随时间变化。这就是你将如何测试你的零假设:λλ

零假设为真

跨时间汇集所有网络流,并使用泊松分布的最大似然估计λ

零假设不成立

分别估计,以便得到两个不同的值(每个时间段一个)。λ

然后,您可以根据似然比等标准选择更好地拟合数据的模型(合并或分离)