如何估计电子商务网站的用户项目购买概率?

数据挖掘 推荐系统 可能性 数据科学模型
2022-03-11 06:49:22

我正在写我的硕士论文,目标是估计用户项目的购买概率。换句话说,对于给定的用户,他/她购买某件商品的概率是多少。我有会话日志(点击用户项目的会话)并从电子商务网站购买。

我发现评估非常困难。因此,我的方法如下:

1 在给定当前会话(和更早的会话)的情况下,预测用户在下一个会话中购买东西的概率。使用它,我可以过滤掉有合理概率购买东西的人。

2 我想取前 50 个项目(由当前存在的推荐系统推荐/排名),并从这些项目中估计概率。(因为从所有项目中估计这一点根本不可能评估)。

我可以做的其他事情就是只查看用户点击的项目,并估计这些概率。

最大的问题是如何评估这些概率?

有人可以帮我定义问题,或者给我一些关于如何继续的提示/提示吗?如果这不可能,我必须为我的论文寻找另一个(相关)主题。

1个回答

如果有可用的用户会话,我建议进行基于会话的推荐 - 当我们根据当前用户的会话推荐下一个点击/购买项目时。这似乎最适合您的数据,也是在电子商务中进行推荐系统的非常有吸引力的方式,当大多数用户在搜索购买或橱窗购物时仍然没有登录时。

在预测下一步行动时,可以使用的措施很少。但从实际的角度和当前的出版物来看,有两个非常有趣:

  • REC@N - 召回前 N 个最佳推荐项目。该衡量标准提供了有关用户整体参与度的信息,并且很多时候据说这与现场(生产)使用的点击率相关。

  • MRR@N - 排名前 N 的推荐的平均倒数排名,它为您提供有关当前会话预测的个性化排名的信息。

我建议阅读最近两篇关于基于会话的推荐的论文——一篇是关于根据项目序列进行下一个项目推荐的 [1]。另一个 [2] 是关于在您拥有推荐项目和会话事件的丰富上下文时基于当前用户的会话进行推荐。对于电子商务系统来说这主要是正确的,您可以通过以下方式描述项目:标题、属性、文本描述、图像等。而且在用户会话中还有其他事件,如搜索引擎的交互,这给了很多用户偏好在查询的数据中,按哪个属性排序等。这可以用作当前会话上下文。在这两部作品中,您都可以找到相关作品的参考资料,这可能对您有所帮助。

[1]:Hidasi, B.、Karatzoglou, A.、Baltrunas, L. 和 Tikk, D. (2015)。使用递归神经网络的基于会话的建议,1-9。取自http://arxiv.org/abs/1511.06939

[2]:Twardowski, B. (2016)。使用神经网络在会话感知推荐系统中建模上下文信息,0-3。http://doi.org/10.1145/2959100.2959162