我有一个数据挖掘任务,我在其中制作基于内容的图像检索系统。我有 5 种动物的 20 张图片。所以总共有100张图片。
我的系统将 10 个最相关的图像返回到输入图像。现在我需要使用 Precision-Recall 曲线来评估我的系统的性能。但是,我不理解 Precision-Recall 曲线的概念。假设我的系统为大猩猩图像返回 10 张图像,但其中只有 4 张是大猩猩。返回的其他 6 张图像是其他动物的。因此,
- 精度是
4/10 = 0.4
(返回的相关项)/(全部返回) - 召回是
4/20 = 0.2
(相关返回)/(所有相关)
所以我只有一个点,<0.2,0.4>
而不是曲线。我如何有一条曲线(即一组点)?我是否应该更改返回的图像数量(在我的情况下固定为 10)?