重新存储每周销售数据并计算描述性统计数据

数据挖掘 时间序列 描述性统计
2022-02-12 06:29:34

我每周都有这样的销售数据:

weekID product SoldQty
1      1       10
2      1       20
3      1       30
4      1       40
5      1       50
6      1       60
7      1       70

1      2       10
2      2       20

计算每种产品每周销售额的标准差非常简单。

现在,我要问一个问题:你如何计算相同数据的标准偏差,但每两周一次?x-weekly 桶装?

问题 2:是否有一种有效的算法来计算每周数据而不是具体化 x 周组合?

从业务方面来看,这意味着我对每种产品都有不同的预测范围(1 周、4 周、6 周……)。我想在预测范围内建立 SoldQty 预测的置信区间。

这一切似乎与物流的安全库存计算非常相似,但我想确定一下。

更新:

请考虑有多种方法可以重新存储(重新组合)这些数据。我认为如果新存储桶包含 W 周,则有 W 种方法可以重新存储数据。以 2 周存储桶为例。

方式一:

bucket wkid prod sold
1      1    1    10
1      2    1    20
2      3    1    30
2      4    1    40
3      5    1    50
3      6    1    60
4      7    1    70
...

方式二:

bucket wkid prod sold
1      1    1    10
2      2    1    20
2      3    1    30
3      4    1    40
3      5    1    50
4      6    1    60
4      7    1    70
...

这两种选择在商业方面都有意义。本质上,您需要计算两周内销售额之间的标准差。并且,方式 2 的标准偏差应该与方式 1 不同。

提前感谢您的建议!

1个回答

如果按照您的说明给出了周 ID,请计算存储桶变量wx=int(weekID/x). 然后使用 SQL 语句将卷汇总到级别wx.