如何建模用户在亚马逊上的购买行为?

数据挖掘 机器学习 数据挖掘 数据集 推荐系统
2021-09-20 10:00:56

对于我们在数据科学的期末课程项目,我们提出了以下建议 -

亚马逊评论数据集,我们计划提出一种算法(大致基于个性化的 PageRank)来确定在亚马逊上投放广告的战略位置。例如,亚马逊上有数百万种产品。数据集让您了解哪些产品是相关的,哪些产品被放在一起,一起查看等等。(我们可以用这个信息构建一个图表)它还为您提供与每个产品相关的评论14年。使用所有这些信息,我们将对亚马逊上的产品进行评级/排名。现在,您是亚马逊上的供应商,想要提高其产品页面的流量。我们的算法可帮助您确定图表中可以放置广告的战略位置,从而获得最大流量。

现在,我们教授的问题是,你将如何在没有真实用户的情况下验证你的算法?我们说-

我们可以为一组固定的用户建模。一些用户比第一跳或第五跳更频繁地关注also_boughtalso_viewed链接到第三跳。那里用户的行为是正态分布的。其他一些用户几乎无法导航超过第一跳。这组用户的行为呈指数分布。

我们的教授说 - 无论用户遵循何种分布,用户都在使用类似产品的链接进行导航。您的排名算法还考虑了 b/w 2 产品的相似性来对产品进行排名。所以使用这个验证算法有点cheating伴随一些其他的用户行为,一些更现实的和与算法正交的东西。

关于如何建模用户行为的任何想法?我很高兴提供有关算法的更多详细信息。

2个回答

你将如何验证你的算法?

与其尝试回答第二个问题,不如考虑您对第一个问题的回答可能需要修改......

您在整个数据科学课程中使用了哪些方法来验证学习方法?首先,您要定义一组特定的数字指标来评估模型的成功或失败。其次,你可以使用什么方法来创建一个非常真实的测试群体(比对群体建模更现实)?我要给出的第一个提示是亚马逊评论数据集非常大,因此您的数据非常适合这种方法。我要给出的第二个提示是,这种方法很可能是你在课堂上处理过的 95% 的监督学习问题中使用过的方法......

希望这会有所帮助...如果需要,我将根据 OP 添加的评论对其进行编辑,但不想立即提供解决方案以引发一些有机思考,例如,因为这是一个班级问题,而教授是还试图帮助您自己提出正确的解决方案。

您应该使用的行为模型有两个要求:(1)“更现实”和(2)与您的算法正交。

(1) 现实,让我们假设这意味着行为应该反映在其他更广泛的背景下观察到的行为,而不是亚马逊购买的特定背景。

(2) 正交更容易理解。建模的行为不应由产品之间的相似性驱动。

满足这两个要求的一个简单方法是,购买行为是由社会人口特征驱动的,例如性别、年龄、位置(例如城市地区/农村)和经济限制(收入和价格)。

您有一组用户和一组产品。您可以使用简单但仔细的回归技术来估计社会人口变量与产品需求之间的关系。如果需要,您可以使用外部数据源对重要的缺失变量(例如收入)做出假设。

然后,如果您是供应商,社会人口模型将预测哪些群体最有可能购买您的产品。

我希望这会有所帮助:)