基于相互联系测量数据点之间的距离

数据挖掘 相似 分配 距离
2022-02-14 10:30:59

如何根据两个数据点(或:节点?)的相互链接份额来测量它们之间的距离?

我不知道它的技术术语,所以这里有一个来自科学出版的虚构例子

  • 假设来自杂志Acta Mathematica的所有引用中有 20% 来自Nature杂志

  • Acta Mathematica所有引文中只有 5% 来自罗马尼亚物理学杂志

  • 另一方面,《自然》从不引用数学学报,...

  • ... 而罗马尼亚物理学杂志的10% 被引用到Acta Mathematica

引用 引用 分享
数学学报 自然 15%
数学学报 罗马尼亚物理学杂志 8%
自然 数学学报 0%
罗马尼亚物理学杂志 数学学报 10%

鉴于这种相互联系,罗马尼亚物理学杂志数学学报比罗马尼亚物理学自然杂志彼此“更接近”

有没有一种传统的方法来计算这样的距离?

我认为仅将共同份额相加会过于简单和错误吗?我的意思是:

日记1 杂志2 总和(份额)
数学学报 罗马尼亚物理学杂志 18%
数学学报 自然 15%

这似乎太不成熟和违反直觉。如果Acta Mathematica对Nature的引用达到20%,那么Nature罗马尼亚物理学杂志更“接近” Acta Mathematica吗?这对我来说听起来不对。

我将不胜感激有关“客观”测量这种距离的算法的任何提示!

0个回答
没有发现任何回复~