机器算法验证 - 鉴于我的朋友网络 - 我可以检测到我最“核心”的朋友吗？ - 吾爱随笔录

鉴于我的朋友网络 - 我可以检测到我最“核心”的朋友吗？

机器算法验证描述性统计网络社交网络

2022-03-19 18:52:03

假设我可以从 facebook 下载我的朋友列表，其中哪些是彼此的朋友 - 我可以从这些信息中估计哪些是“中心”的吗？（我不完全确定在这种情况下如何定义“中心”）

需要什么信息/假设？

谢谢。

3个回答

最简单的解决方案是计算您的每个朋友与您有共同点的朋友数量，然后将其反转并将其用作中心度的衡量标准。

比这更远的任何事情都必然需要额外的假设：您始终可以将所有朋友之间的距离（沿着最短的朋友路径，不包括您）相加（并且“总距离”最小的那个将是“最中心的”）。但是你必须决定：较长距离的“重量”是多少：假设你正在考虑从 A 和 B 到人 C、D 和 E 的距离，它们分别是 3,1,2 和 4,1， 1：你认为总距离一样吗？

此外，如果您想避免完全断开连接的人（这会使总和变得尴尬，因为您必须为“断开连接”的人的距离指定一个硬数字），您可能必须允许您自己的朋友圈之外的连接（例如：您和 100 个认识我的人是朋友，但你没有和我成为朋友，这 100 个人也不一定是朋友）。但即便如此，您的“朋友图”中的节点可能已断开连接。

最后，您可能还必须权衡自己的联系：也许是建立友谊的日期，也许是在任何一方的墙上张贴的消息数量（这甚至可能使“距离”不对称），发起友谊的人（发送“请求”）或有关关系（家庭关系等）的详细信息可能对您的“兴趣距离”很重要。

总而言之：你必须指定你的目标是什么，并调整你的距离测量。肯定会有很多关于图表中距离的文献，但都需要弄清楚你对哪个距离感兴趣。

定义“最核心”朋友的方式有很多很多。这些被称为中心性度量。可能最常见的三个是这些，并带有一些简单的英语解释。

度数：朋友 A 有多少朋友？
亲近度：从朋友 A 到您网络上的任何其他朋友需要经过多少步骤？
介数：网络中的朋友之间有多少条路径通过朋友 A？

有时这些非常相似，并且突出了相同的“重要”人物。有时，他们会给出有趣的结果，即使没有大量联系的人也是几乎每个人的“朋友的朋友”，或者连接两个不同的群体。这些只是其中的一小部分——正如我所说，有很多不同的方式来看待中心性，有很多曲折。

很多软件会让你看看这些措施。如果您了解 Python，我个人最喜欢的是 NetworkX。NodeXL 适用于 Excel，sna 是处理它的 R 包之一，等等。

就您需要的信息而言……显然，您需要网络本身。您假设的一件事是您收集的网络（在本例中为 Facebook）足以代表您所询问的实际友谊网络。因此，例如，人们在他们的朋友列表中没有他们懒得删除的人，或者没有选择退出社交网络的对您的网络很重要的人。或者在 Facebook 的情况下，没有欺骗帐户。

查看NodeXL（一个简单但功能强大的用于网络分析的 Excel 扩展）和一书 Analyzing Social Media Networks with NodeXL: Insights from a Connected World。即使您将使用其他一些软件，这本书也肯定会很好地讨论各种中心性度量及其用途。我面前没有它，但我似乎记得它解决了营销背景下的优先级问题。

其它你可能感兴趣的问题

上一篇在时间序列分析中发现异常值，我是否应该预处理数据？下一篇预测金融时间序列的k-fold CV——最后一折的表现是否更相关？