我被这个问题困住了。假设我们有下一个信息。
CustomerID:1,日期:3/2/2018,数量:3,总计:390.78,最小值:130.26,最大值:130.26
我们想确定给定一天、一个月和一年的总销售额,直到那个月的最后一天,我正在使用 Microsoft Azure 机器学习工作室,我稍微修改了数据(我知道一点Python 和 R),我们可以在一天内获得下一个数据。
日期:2018 年 3 月 2 日,TotalSalesToday:4023.45,FirstToToday:1322.92 TargetValue:42611.27
其中 TargetValue 是截至该月最后一天的销售额总和(或我们想要预测的值),FirstToToday 是从第一天到那一天的销售额总和,TotalSalesToday 是该月的销售额总和天。在给定日期的情况下,我们可以找到或生成一些列,例如 RemainingWorkDays、RemainingHolidays、RemainingNonWorkDays 等。也许我们可以用 31 个列告诉 ML -1 之前的所有天数的总和,之前的所有天数 - 2,以此类推。
我在 Microsoft Azure Machine Learning Studio 上做了一个实验,它给出了 100% 的确定系数(我使用的是 Boosted Decision Tree Regression 和 Tunel Model Hyperparameters),我认为这是因为 ML 知道在给定的月份中 TargetValue 不会改变它的价值,所以它会像 if(month == 2) PredictValue = 42611.27,我能做什么?在测试这个 ML 时,假设在第一天我们得到了 TotalSalesToday: 1000000,所以我的 ML 返回 50000,显然这不是关于这个值 (1000000) 的逻辑和连贯的答案。
我需要在数据中更改什么吗?为了让 ML 至少给出一个连贯的答案,我们需要什么?有什么我忘记了吗?
提前致谢!!:)