如何计算 F1 分数?

数据挖掘 机器学习
2022-02-16 17:48:24

最近我在一篇论文中读到了路径排序算法(来源:Knowledge Vault: A Web-Scale Approach to Probabilistic Knowledge Fusion)。

在这篇论文中有一个包含事实的表格(表 3),我试图了解它们是如何计算的。

F1(准确率和召回率的调和平均值)= 0.04
P(准确率)= 0.03
R(召回率)= 0.33
W(逻辑回归赋予该特征的权重)

我通过 Google 找到了 F1 的公式

F1=2precisionrecallprecision+recall

问题是我用这个公式得到了 0.055 的结果,而不是 0.04 的预期结果。有人可以帮我得到这部分吗?另外,有人知道如何计算“W”吗?谢谢。

1个回答

首先,您需要了解逻辑回归,它是一种算法,可以在给定一些训练数据的情况下为不同的特征分配权重。阅读 wiki 介绍,很有帮助,基本上那里的 Beta 与论文中的 W 相同。

您拥有的公式是正确的,并且这些值似乎确实不正确。它还取决于您拥有的有效数字的数量,也许他们正在计算的数字超过了他们报告的数字。

但老实说,除非你理解 LR,否则你无法理解论文的大部分内容