考虑一个看似简单但有趣的问题,我想编写一些代码来预测我在不久的将来需要的消耗品,因为我之前购买的完整历史记录。我确信这类问题有一些更通用且经过深入研究的定义(有人认为这与 ERP 系统等中的某些概念有关)。
我拥有的数据是以前购买的完整历史记录。假设我正在查看纸张用品,我的数据看起来像(日期,表格):
2007-05-10 500
2007-11-11 1000
2007-12-18 1000
2008-03-25 500
2008-05-28 2000
2008-10-31 1500
2009-03-20 1500
2009-06-30 1000
2009-09-29 500
2009-12-16 1500
2010-05-31 500
2010-06-30 500
2010-09-30 1500
2011-05-31 1000
它不是定期“采样”的,所以我认为它不符合时间序列数据的条件。
我每次都没有关于实际库存水平的数据。我想使用这个简单而有限的数据来预测(例如)3、6、12 个月内我需要多少纸张。
到目前为止,我才知道我正在寻找的是所谓的外推法,仅此而已:)
在这种情况下可以使用什么算法?
什么算法,如果与前一个不同,也可以利用更多的数据点给出当前的供应水平(例如,如果我知道在日期 XI 还剩下 Y 张纸)?
如果您知道更好的术语,请随时编辑问题、标题和标签。
编辑:为了它的价值,我将尝试在 python 中编写代码。我知道有很多库或多或少地实现了任何算法。在这个问题中,我想探索可以使用的概念和技术,实际的实现留给读者作为练习。