鉴于我的朋友网络 - 我可以检测到我最“核心”的朋友吗?

机器算法验证 描述性统计 网络 社交网络
2022-03-19 18:52:03

假设我可以从 facebook 下载我的朋友列表,其中哪些是彼此的朋友 - 我可以从这些信息中估计哪些是“中心”的吗?(我不完全确定在这种情况下如何定义“中心”)

需要什么信息/假设?

谢谢。

3个回答

最简单的解决方案是计算您的每个朋友与您有共同点的朋友数量,然后将其反转并将其用作中心度的衡量标准。

比这更远的任何事情都必然需要额外的假设:您始终可以将所有朋友之间的距离(沿着最短的朋友路径,不包括您)相加(并且“总距离”最小的那个将是“最中心的”)。但是你必须决定:较长距离的“重量”是多少:假设你正在考虑从 A 和 B 到人 C、D 和 E 的距离,它们分别是 3,1,2 和 4,1, 1:你认为总距离一样吗?

此外,如果您想避免完全断开连接的人(这会使总和变得尴尬,因为您必须为“断开连接”的人的距离指定一个硬数字),您可能必须允许您自己的朋友圈之外的连接(例如:您和 100 个认识我的人是朋友,但你没有和我成为朋友,这 100 个人也不一定是朋友)。但即便如此,您的“朋友图”中的节点可能已断开连接。

最后,您可能还必须权衡自己的联系:也许是建立友谊的日期,也许是在任何一方的墙上张贴的消息数量(这甚至可能使“距离”不对称),发起友谊的人(发送“请求”)或有关关系(家庭关系等)的详细信息可能对您的“兴趣距离”很重要。

总而言之:你必须指定你的目标是什么,并调整你的距离测量。肯定会有很多关于图表中距离的文献,但都需要弄清楚你对哪个距离感兴趣。

定义“最核心”朋友的方式有很多很多。这些被称为中心性度量。可能最常见的三个是这些,并带有一些简单的英语解释。

  1. 度数:朋友 A 有多少朋友?
  2. 亲近度:从朋友 A 到您网络上的任何其他朋友需要经过多少步骤?
  3. 介数:网络中的朋友之间有多少条路径通过朋友 A?

有时这些非常相似,并且突出了相同的“重要”人物。有时,他们会给出有趣的结果,即使没有大量联系的人也是几乎每个人的“朋友的朋友”,或者连接两个不同的群体。这些只是其中的一小部分——正如我所说,有很多不同的方式来看待中心性,有很多曲折。

很多软件会让你看看这些措施。如果您了解 Python,我个人最喜欢的是 NetworkX。NodeXL 适用于 Excel,sna 是处理它的 R 包之一,等等。

就您需要的信息而言……显然,您需要网络本身。您假设的一件事是您收集的网络(在本例中为 Facebook)足以代表您所询问的实际友谊网络。因此,例如,人们在他们的朋友列表中没有他们懒得删除的人,或者没有选择退出社交网络的对您的网络很重要的人。或者在 Facebook 的情况下,没有欺骗帐户。

查看NodeXL(一个简单但功能强大的用于网络分析的 Excel 扩展)和一书 Analyzing Social Media Networks with NodeXL: Insights from a Connected World。即使您将使用其他一些软件,这本书也肯定会很好地讨论各种中心性度量及其用途。我面前没有它,但我似乎记得它解决了营销背景下的优先级问题。