我是一名新手,寻求帮助以获取数据科学方面的经验。
让我们假设一家大公司想要预测其在不同地理位置的不同商店的销售额(特定产品)。作为一名分析师,任务是预测未来 3 个月的数百个系列(销售额)。由于我们正在预测不同地理位置的销售,因此该系列的性质对于所有这些都不会相同。将有数百个模型可供检查。根据您在该领域的经验,对于这种情况有哪些建议的方法?此外,在这种情况下了解每个系列的性质有多重要?
我是一名新手,寻求帮助以获取数据科学方面的经验。
让我们假设一家大公司想要预测其在不同地理位置的不同商店的销售额(特定产品)。作为一名分析师,任务是预测未来 3 个月的数百个系列(销售额)。由于我们正在预测不同地理位置的销售,因此该系列的性质对于所有这些都不会相同。将有数百个模型可供检查。根据您在该领域的经验,对于这种情况有哪些建议的方法?此外,在这种情况下了解每个系列的性质有多重要?
我可以从预测库中建议auto.arima函数,如果您是 R 用户,如果您是 Python 用户,请点击此链接。您所需要的只是编写简单的 for 循环,它允许您在不同的地理位置构建最佳 ARIMA 模型:
for (my_time_series in set_of_all_time_series){
model=auto.arima(my_time_series )
}
您可以通过相关性对时间序列进行聚类(确保您的时间序列是固定的,以避免虚假相关)。如果这减少了时间序列的数量(这将取决于相关性的阈值),您可以从每个类中获取任何 1 个成员,构建任何模型(不仅是 ARIMA)并将模型结果应用于该类的每个成员。
合约VAR模型