具有聚合约束的动态定价

数据挖掘 机器学习 强化学习
2022-02-13 06:53:54

所以我有这种情况。我试图了解我的客户是否会根据之前向他们提供的报价以特定价格购买我的产品。具体来说,我有很多关于我的客户的数据,并且我已经推出了之前的“活动”轮,我看到了谁买了它,谁没有买。现在我正在尝试为那些没有的人校准新价格,并且我想找到使他们购买它的机会最大化的价格,但同时我有一个我必须坚持的总约束(加权总利润率)。

我处于早期阶段,但我想了解此类问题的参考模型。非常感谢任何与哪个领域/材料最相关的建议。

ps:我试图在论坛上搜索类似的问题但没有成功,但如果我错过了什么,请关闭问题并请我参考该内容。

1个回答

嗨 Asher11,欢迎来到社区。我过去曾从事定价工作,尽管您的问题很笼统,但我会尽力为您提供一些指导。这一切都归结为你想如何制定你的问题。我建议您不要先寻找模型,而要弄清楚您面临的问题并转化为数学。

例如:

  • 您是否想知道客户是否会根据他们的某些特性(特征)购买特定产品?然后你有一个预测问题。您可以用一组特征来代表每个客户,并尝试通过训练监督学习模型来预测他们是否会购买产品。从线性回归开始,以获得性能基线。

  • 您想优化利润/收入吗?那么你有一个优化问题,你可能可以使用强化学习方法来解决它。如果事件的顺序(提供和购买)在决策中没有发挥重要作用,那么您可以尝试 Bandit 理论中的算法。

您需要回答的另一个问题是为什么要使用 ML 方法?您可能会感到惊讶,但通过查看线性规划的定价优化,您将获得一种更简单的解决方案。您需要对每个产品(或一组产品)的供需曲线做出一些假设,添加适当的约束并进行优化以获得最佳价格。产品分组可以使用 ML 方法或根据您的直觉来完成。通过做这个练习,你将开始了解解决问题的最佳方法。

请注意,为了训练 RL 代理以优化利润/收入,这意味着代理将尝试实时随机价格(RL 训练基于反复试验)。出于这个原因,您需要寻找有关如何预训练网络以建议特定范围内的价格的技术,然后实时使用 RL,而不必担心算法会输出不合理的值。另一种方法是使用您拥有的数据构建一个“市场”模拟器,并直接在那里训练 RL 代理。

通过编写上述内容,我试图为您提供一些您可以查找的关键字,以便更好地指定您的问题并可能找到解决方案。