如何从概率事件中生成未来预测?

数据挖掘 时间序列 预报
2021-09-15 22:17:10

我有一个事件“出售的物品是否会被退回”,我可以根据购买时收集的信息(产品功能、客户信息、时间和地点等)以一定的概率预测该事件。所以:

P(Return | transaction information) = x% for a specific unit sold

我还有该商品总销量的历史时间序列,以及该商品在未来几周内的销售预测。假设我为每个发生的历史销售提供了相关交易数据,是否可以根据退货概率生成未来预测,这样我就可以有信心地说下周我将获得 15% 的商品总回报率,10 % 后一周等?

3个回答

如果你有销售后几周回报率的历史数据,我相信你可以做到。这将是一个多输出回归问题,例如,您必须以某种方式制定目标值(即输出矩阵),以便第一周的 %-return 将在第一列中,第二周的 %-return 将在列中两个等等。在此之后,插入所有输入变量并运行多变量多输出回归算法。可以在 scikit-learn 上找到这样的算法(sklearn.multioutput.MultiOutputRegressor: here

您可能希望进行一些数据聚合。
对于每周和每个项目单元,汇总其所有记录,以便您可以定义返回的数量,还需要公开交易,以便它可以推断出这些退货数量,然后将问题表述为时间序列,您将时间步长定义为周,通过计算返回单位的相对值而不是绝对值来预处理数据,应用 z-score 归一化,然后通过将数据提供给类似 RNN 的模型来自动编码数据以预测值在给定前 t 个时间步的时间步 t+1 处。

一个潜在的想法可能是将其视为分类问题:手动标记返回并训练具有概率输出的逻辑回归。现在你可以给出一个概率性的答案。