在有趋势时预测没有历史数据的能源消耗

数据挖掘 机器学习 Python 时间序列 预测
2022-02-23 23:46:20

我想预测新客户的能源消耗。假设我可以构建一组属性来描述新客户和现有客户(例如业务规模、业务类型等),并且我有现有客户能源消耗的时间序列数据。但是,我没有新客户消费的历史数据。

如果现有客户的消费有季节性但没有趋势,我可以使用这组属性创建一个回归模型,根据现有客户的消费来预测新客户的消费。但是,如果现有客户的消费有趋势呢?我怎么知道我应该在时间序列的哪个点开始预测?

让我们以现有客户的以下示例时间序列为例: 在此处输入图像描述

如果我想预测一年新客户的消费,我怎么知道在这个时间序列的哪个点开始预测?

我还没有数据集,所以我无法提供数据示例。答案可能包括我需要什么类型的附加信息(如果有的话)来解决这个问题。能源消耗只是一个例子,我的问题是理论上的,可以推广到任何其他领域。此外,欢迎使用处理此问题的 python 库名称!

感谢您的帮助。

1个回答

大多数时间序列模型都假设平稳。因此,您应该考虑数据中的趋势和季节性,并从原始数据中减去相应的成分。之后,您还可以使用任意机器学习模型对标准化数据进行建模;并使用新数据预测接下来的几个月。

请注意,您可能具有解释趋势或季节性成分的特征。如果这些组件也随着时间发生变化或预计会发生变化,您可以组合(例如添加附加时间序列模型)所有组件的预测。即趋势、季节性和残差预测的总和。

标准化的重要性 例如https://stats.stackexchange.com/q/31387/214243

去趋势 减去每个月的 % yoy 变化。

季节性分解 例如 http://www.statsmodels.org/stable/release/version0.6.html?highlight=seasonal#seasonal-decomposition

预测 有大量的统计时间序列模型(AR、ARIMA、GARCH、...)。但是当数据被标准化时,常见的机器学习模型,如决策树或随机预测也可能适用(参见sklearn库)