随时间推移的销售预测

数据挖掘 时间序列
2021-09-20 17:55:18

我想对商店销售的演变进行建模。

这是我拥有的数据:

数据表

  • 客户根据首次购买日期汇总到每月群组中, 例如:2015 年 1 月进行第一次购买的客户属于群组 1,2015 年 Fev 进行第一次购买的客户属于群组 2。

  • 销售额:每月汇总*队列(队列 4 不可见,因为只有 1 条记录没有行)

销售时间

如果我们将所有队列放在同一个原点: 在此处输入图像描述

问题:如何预测未来2个月的支出,即:

  • 队列 1 在 5 岁和 6 岁时的支出
  • 队列 2 在 4 岁和 5 岁时的支出
  • 第 3 组在 3 岁和 4 岁时的支出
  • 第 4 组在 2 岁和 3 岁时的支出

但也适用于尚不存在的队列:

  • 第 5 组在 1 岁和 2 岁时的支出
  • 队列 6 在其老龄化 1 中的支出

我有两种方法,但不知道它们是否好:

  1. 使用 2 个参数进行多项式回归:
    • 老化:因为随着时间的推移有明显的演变,先上后下。
    • 队列数量:因为最近的队列似乎花费更少。
  2. 时间序列:我最近没有执行时间序列我有点生锈,所以我更喜欢使用其他东西,但我认为它可以解决这个问题。

事实上,显然 y t-1 t in y t-2 ... 是 y t 的良好预测指标,如何预测没有历史的未来队列的支出?

2个回答

听起来你让这件事变得比尝试预测同类群组级别的支出更复杂。最好使用群组来了解“为什么”会发生某事,并使用时间序列分析来了解“会发生什么”。

R 中的 Forecast 包似乎可以解决您的问题。只需预测每月支出即可!

首先,群组主要用于描述性和推理性分析,而不是预测性分析。

仔细查看您的数据集后,我看到了明显的季节性周期性,并且可能存在可以观察到的趋势。因此,我的建议是进行时间序列分析(从基本的季节性朴素(snaiveR 中)算法开始)。snaive条线会给你一个很好的想法,是继续使用时间序列还是使用回归方法等更简单的估计。

如果存在季节性和趋势,那么snaive拟合将比简单回归更准确。当然,置信区间会随着您从