如何根据两个数据点(或:节点?)的相互链接份额来测量它们之间的距离?
我不知道它的技术术语,所以这里有一个来自科学出版的虚构例子:
假设来自杂志Acta Mathematica的所有引用中有 20% 来自Nature杂志。
Acta Mathematica的所有引文中只有 5% 来自罗马尼亚物理学杂志。
另一方面,《自然》从不引用数学学报,...
... 而罗马尼亚物理学杂志的10% 被引用到Acta Mathematica。
| 引用 | 引用 | 分享 |
|---|---|---|
| 数学学报 | 自然 | 15% |
| 数学学报 | 罗马尼亚物理学杂志 | 8% |
| 自然 | 数学学报 | 0% |
| 罗马尼亚物理学杂志 | 数学学报 | 10% |
鉴于这种相互联系,罗马尼亚物理学杂志和数学学报比罗马尼亚物理学和自然杂志彼此“更接近” 。
有没有一种传统的方法来计算这样的距离?
我认为仅将共同份额相加会过于简单和错误吗?我的意思是:
| 日记1 | 杂志2 | 总和(份额) |
|---|---|---|
| 数学学报 | 罗马尼亚物理学杂志 | 18% |
| 数学学报 | 自然 | 15% |
这似乎太不成熟和违反直觉。如果Acta Mathematica对Nature的引用达到20%,那么Nature会比罗马尼亚物理学杂志更“接近” Acta Mathematica吗?这对我来说听起来不对。
我将不胜感激有关“客观”测量这种距离的算法的任何提示!