点击频率是否考虑了相关性?

数据挖掘 推荐系统 信息检索
2021-09-20 00:00:08

在为搜索引擎或推荐系统建立排名时,依靠点击频率来确定条目的相关性是否有效?

3个回答

对于初学者来说,取决于用户的意图。

用户通常只查看第一组链接,这意味着除非链接可见,否则不会获得点击;这意味着你必须肯定那些是最好的链接,否则点击很可能会反映位置,而不是相关性。例如,下面是 Google 搜索结果的点击和注意力分布热图:

Google SEPR 点击和注意力分布“热图”

此外,使用点击频率来说明相关性并不是资源相关性的直接衡量标准。此外,使用点击是有问题的,因为点击膨胀、点击欺诈等问题会弹出并且难以应对。

也就是说,如果您有兴趣使用用户交互来模拟相关性,我建议您尝试衡量点击后的参与度,而不是用户对搜索结果的响应方式;有关更多信息,请参阅“ YouTube 的工程主管谈论点击次数与参与度”,但请注意内容的大小本身也是一个因素

可能值得注意的是,谷歌在历史上以PageRank 算法而闻名,尽管您的意图可能只是查看点击流,所以我不会深入研究谷歌排名因素如果您对 Google 的方法感兴趣,可以查看Google 的搜索质量评级指南

就我而言,我可以说我在即电子商务产品上使用点击频率。当您将它与一年中的日子结合起来时,它甚至可以为您带来很好的建议。

即:我们有 1 年以上 2 种产品的历史数据(Snowboots[]、Sandalettes[])

Snowboots[1024,1253,652,123,50,12,8,4,50,148,345,896]
Sandalettes[23,50,73,100,534,701,1053,1503,1125,453,213,25]

其中 [0] = 一月

如您所见,雪地靴在 1 月份的搜索量比凉鞋要多得多,因此您应该向在您的网站或 /we 在一月份搜索鞋子的人推荐雪地靴。

您还可以查看此时某些东西是否“新鲜”,例如当人们经常点击未知产品时,这可能是对新趋势或其他东西的洞察。

这只是您可以使用点击频率作为洞察力的一些示例。我认为在推荐中你可以使用或不使用什么没有规则,只要它有意义

使用点击频率是否有效,然后使用点击频率是否有效,那么可能没有

搜索相关性远比一个指标复杂得多。有关于这个主题的整本书将此答案扩展到简单的是/否可能会使答案过于广泛(和固执己见)