我们能否量化搜索结果中的位置与点击概率的关系?

数据挖掘 推荐系统 搜索 信息检索 回归
2021-09-29 20:18:29

例如,假设 Google 搜索结果页面上的第一个搜索结果与第二个结果交换。这会在多大程度上改变两个结果的点击概率?如果将第五个搜索结果与第六个交换,它的点击率会下降多少?

如果我们在搜索结果页面中进行这些类型的成对交换,我们能否在一定程度上保证预期点击概率会发生怎样的变化?

我们寻求的是衡量位置偏差对点击率的贡献。

可能,排名将如何影响亚马逊或其他在线购物网站的销售?如果我们把销售额分成两部分,产品质量和排名效应。

sales = alpha*quality + beta*position + epsilon

我们如何量化贝塔?

3个回答

您可能想看看这篇论文 预测点击:估计新广告的点击率

每当广告显示在搜索结果页面上时,它都有一定的机会被用户查看。广告显示在页面下方越远,被查看的可能性就越小。为简化起见,我们认为广告被点击的概率取决于两个因素:a) 被查看的概率,和 b) 在被查看的情况下被点击的概率:

这只是逻辑回归。获取一堆关于搜索结果展示的数据,以及一个项目是否被点击。一个实例是一个搜索结果项,可能的特征是排名、“质量”(不确定您的意思)等。您要问的是与排名相关的参数的推断问题。

以您定义或设置问题的方式,即

sales = alpha*quality + beta*position + epsilon

beta鉴于您的模型是正确的,我们可以轻松量化。你只需要通过线性回归运行它,它会给你beta*的系数。

如果您想对点击率进行建模,则必须训练分类器。所以你必须拟合一个逻辑模型来建模:

clicks ~ alpha*quality + beta*position + epsilon

*我相信您必须将训练集限制为包含在第一页上获得所有印象的结果,否则您的模型将不成立(我猜这beta将强烈依赖于页面)。