假设我可以从 facebook 下载我的朋友列表,其中哪些是彼此的朋友 - 我可以从这些信息中估计哪些是“中心”的吗?(我不完全确定在这种情况下如何定义“中心”)
需要什么信息/假设?
谢谢。
假设我可以从 facebook 下载我的朋友列表,其中哪些是彼此的朋友 - 我可以从这些信息中估计哪些是“中心”的吗?(我不完全确定在这种情况下如何定义“中心”)
需要什么信息/假设?
谢谢。
最简单的解决方案是计算您的每个朋友与您有共同点的朋友数量,然后将其反转并将其用作中心度的衡量标准。
比这更远的任何事情都必然需要额外的假设:您始终可以将所有朋友之间的距离(沿着最短的朋友路径,不包括您)相加(并且“总距离”最小的那个将是“最中心的”)。但是你必须决定:较长距离的“重量”是多少:假设你正在考虑从 A 和 B 到人 C、D 和 E 的距离,它们分别是 3,1,2 和 4,1, 1:你认为总距离一样吗?
此外,如果您想避免完全断开连接的人(这会使总和变得尴尬,因为您必须为“断开连接”的人的距离指定一个硬数字),您可能必须允许您自己的朋友圈之外的连接(例如:您和 100 个认识我的人是朋友,但你没有和我成为朋友,这 100 个人也不一定是朋友)。但即便如此,您的“朋友图”中的节点可能已断开连接。
最后,您可能还必须权衡自己的联系:也许是建立友谊的日期,也许是在任何一方的墙上张贴的消息数量(这甚至可能使“距离”不对称),发起友谊的人(发送“请求”)或有关关系(家庭关系等)的详细信息可能对您的“兴趣距离”很重要。
总而言之:你必须指定你的目标是什么,并调整你的距离测量。肯定会有很多关于图表中距离的文献,但都需要弄清楚你对哪个距离感兴趣。
定义“最核心”朋友的方式有很多很多。这些被称为中心性度量。可能最常见的三个是这些,并带有一些简单的英语解释。
有时这些非常相似,并且突出了相同的“重要”人物。有时,他们会给出有趣的结果,即使没有大量联系的人也是几乎每个人的“朋友的朋友”,或者连接两个不同的群体。这些只是其中的一小部分——正如我所说,有很多不同的方式来看待中心性,有很多曲折。
很多软件会让你看看这些措施。如果您了解 Python,我个人最喜欢的是 NetworkX。NodeXL 适用于 Excel,sna 是处理它的 R 包之一,等等。
就您需要的信息而言……显然,您需要网络本身。您假设的一件事是您收集的网络(在本例中为 Facebook)足以代表您所询问的实际友谊网络。因此,例如,人们在他们的朋友列表中没有他们懒得删除的人,或者没有选择退出社交网络的对您的网络很重要的人。或者在 Facebook 的情况下,没有欺骗帐户。
查看NodeXL(一个简单但功能强大的用于网络分析的 Excel 扩展)和一书 Analyzing Social Media Networks with NodeXL: Insights from a Connected World。即使您将使用其他一些软件,这本书也肯定会很好地讨论各种中心性度量及其用途。我面前没有它,但我似乎记得它解决了营销背景下的优先级问题。