我正在研究一个排名问题,以根据用户查询预测正确的单个文档,并使用 NDCG 指标来衡量模型。
鉴于细节:
查询 ( Q )、结果文档 ( D )、相关性分数。但是相关性分数是二进制的(0 或1),即在文档列表中,只有一个文档被标记为相关性分数=1。
数据集示例:
query, docs,relevance
{
[1, doc2,0],[1, doc3,0],[1, doc4,0 ],[1, doc6,1],[1, doc9,0]
[2, doc3,0],[2, doc5,1],[2, doc10,0],[2, doc11,0],[2, doc1,0]
}
我的问题: 1. 是否可以使用 NDCG 度量来解决二元相关问题?2. 如果有,请分享一些阅读笔记或建议。
谢谢