我可以使用什么机器学习算法来确定日期中的某些度量?

数据挖掘 机器学习 Python r 机器学习模型 天蓝色毫升
2022-03-08 01:53:37

我被这个问题困住了。假设我们有下一个信息。

CustomerID:1,日期:3/2/2018,数量:3,总计:390.78,最小值:130.26,最大值:130.26

我们想确定给定一天、一个月和一年的总销售额,直到那个月的最后一天,我正在使用 Microsoft Azure 机器学习工作室,我稍微修改了数据(我知道一点Python 和 R),我们可以在一天内获得下一个数据。

日期:2018 年 3 月 2 日,TotalSalesToday:4023.45,FirstToToday:1322.92 TargetValue:42611.27

其中 TargetValue 是截至该月最后一天的销售额总和(或我们想要预测的值),FirstToToday 是从第一天到那一天的销售额总和,TotalSalesToday 是该月的销售额总和天。在给定日期的情况下,我们可以找到或生成一些列,例如 RemainingWorkDays、RemainingHolidays、RemainingNonWorkDays 等。也许我们可以用 31 个列告诉 ML -1 之前的所有天数的总和,之前的所有天数 - 2,以此类推。

我在 Microsoft Azure Machine Learning Studio 上做了一个实验,它给出了 100% 的确定系数(我使用的是 Boosted Decision Tree Regression 和 Tunel Model Hyperparameters),我认为这是因为 ML 知道在给定的月份中 TargetValue 不会改变它的价值,所以它会像 if(month == 2) PredictValue = 42611.27,我能做什么?在测试这个 ML 时,假设在第一天我们得到了 TotalSalesToday: 1000000,所以我的 ML 返回 50000,显然这不是关于这个值 (1000000) 的逻辑和连贯的答案。

我需要在数据中更改什么吗?为了让 ML 至少给出一个连贯的答案,我们需要什么?有什么我忘记了吗?

提前致谢!!:)

1个回答

我将计算您的销售数据的每日增量,并通过使用 Azure ML R/Python 模型模块来实现时间序列预测模型,该模块预测到月底的每日增量并返回生成的每月总和。

如果您不熟悉时间序列分析,这里有一个链接,很好地描述了一些基本方法以及如何使用 R 应用它们。

我认为,将使用ARIMA模型预测每日增量。我发现这个网站包含对使用 R 的时间序列分析工作流程的描述,您可以使用它找到一个好的 ARIMA 模型。

希望以上内容对你有用。