如何进行这种复杂的数据外推、预测建模?

数据挖掘 数据挖掘 时间序列
2021-09-24 23:14:04

我有一些关于在线电影销售的非常复杂的数据,首先对于每个数据条目,我有一个由五个键组合而成的键,它们是区域、日期等,然后,对于每个键,我都有一个销售量时间段和其他信息,例如电影的票房和类型。

每天,数据加载到数据库都有延迟,大约十个小时,我尝试填补空白,做一些数据外推。

对于我们销售的每部电影,自电影新发行以来,都会出现一些销售衰减,即通常对于每部电影,它都遵循一些销售衰减模式。

最近一天,我提取了一些数据,发现了一些衰减模式:

衰减曲线 1

衰减曲线 2

衰减曲线 3

在那一天,每把钥匙的销售额可以从大约 1500000. 图片如下:

一日销售曲线

在图片中,15000 表示每天大约有 15000 个密钥。

找到这篇文章

我正在尝试预测每个键的销售额,例如电影,地区,日期等组合,销售额,多少美元,对于那部电影,那个地区,那一天,我们从销售中获得多少钱在线的。我尝试了 ARIMA 时间序列模型,但该模型存在一些问题,从图片上看,电影有一些季节性的东西,还有衰减的东西,所以销售预测不能总是持平,之后可能会有暴涨一个下降,它可能发生在一个周末,因为有季节性的东西,衰变趋势等,如何捕捉这些东西。感谢你的回复!

我不确定是否可以申请,以及如何申请。

提前非常感谢。

1个回答

我不确定我是否理解了这个问题,但是如果您试图预测销售额,我的猜测是 ARIMA 可能不是正确的选择,因为它不会考虑外部变量。我的建议是收集相关特征,例如另一部电影如何来自该地区一年中那个时候的相同类型,天气,明星出现,当时其他热门比赛或锦标赛的出现等等。让我知道你的想法。