我目前正在阅读亚马逊发布的语义产品搜索论文。他们正在使用两个评估子任务匹配和排名。在匹配中,他们调整模型超参数以最大化 Recall@100 和平均平均精度 (MAP)。
根据Introduction to Information Retrieval,Precision (P) 是检索到的相关文档的分数:
召回率 (R) 是检索到的相关文档的比例:
如果不可用,我想知道如何提出基本事实(相关性标签)?换句话说,如果我想计算语义产品搜索的精度或召回率,并且我们没有可用于输入产品查询的相关性标签。在那种情况下,研究人员如何计算准确率和召回率?或者他们如何生成它?