如果不能为负数,连接数怎么可能是高斯的?

机器算法验证 分布 网络 中心极限定理
2022-03-14 22:57:50

我正在分析社交网络(不是虚拟的),我正在观察人与人之间的联系。如果一个人随机选择另一个人连接,那么一组人中的连接数将呈正态分布——至少根据我目前正在阅读的书。

我们怎么知道分布是高斯(正态)分布?还有其他分布,例如 Poisson、Rice、Rayliegh 等。理论上高斯分布的问题是值从(尽管概率趋向于零)并且连接数不能消极的。+

有谁知道如果每个人独立(随机)接另一个人联系,可以预期哪种分布?

2个回答

当有个人且个人时,则连接总数为现在,如果我们将视为随机变量,假设它们是独立的,并且随着越来越多的人被添加到组合中,它们的方差不是“太不相等”,那么Lindeberg-Levy 中心极限定理适用。它断言标准化和的累积分布函数收敛于正态分布的 cdf。这大致意味着总和的直方图看起来越来越像高斯(“钟形曲线”),因为ni,1in,XiSn=i=1nXi/2Xin变大。

让我们回顾一下这没有说什么:

  • 它没有断言的分布是完全正态的。不可能,因为你指出的原因。Sn

  • 这并不意味着预期的连接数会收敛。事实上,它必须发散(去无穷大)。标准化是对分布的重新定位和重新调整;重新调整的数量正在无限增长。

  • 的增长而变化太大时,它什么也没说。(但是,CLT 对“稍微”依赖的变量系列进行了概括。)Xin

答案取决于您愿意做出的假设。社交网络随着时间的推移不断发展,因此不是一个静态实体。因此,您需要对网络如何随时间演变做出一些假设。

在所述条件下的简单答案是:如果网络大小为,则渐近(在“时间趋于无穷大”的意义上)n

Prob(No of connections for any individual=n1)=1 .

如果一个人随机选择另一个人连接,那么最终每个人都会被连接。

然而,现实生活中的网络并非如此。人们在几个方面有所不同。

  1. 在任何时候,一个人都有一个固定的网络大小,并且建立另一个连接的概率是他/她的网络大小的函数(当人们介绍其他人等)。

  2. 一个人有他/她自己形成联系的内在倾向(因为有些人是内向/外向等)。

这些概率会随着时间、上下文等而变化。我不确定是否有一个简单的答案,除非我们对网络的结构做出一些假设(例如,网络的密度、人们的行为方式等)。