对于这个负载预测问题,哪种机器学习技术最好?

数据挖掘 机器学习 无监督学习 监督学习
2022-02-17 19:07:28

我正在尝试使用机器学习来预测一整年任何时间点的住宅负载。我有关于那所房子的过去数据。所以我有训练数据,我需要算法来预测房子的未来负荷。

根据我的知识,我发现“监督”机器学习技术是我必须适应的一种技术。我发现了这一点,因为我已经标记了测试数据,我有一个预测要求,我可以得到我的预测的反馈(与实际值交叉检查)。我在这里正确吗?

另外,我在网上读到“无监督”学习将用于我们需要找到“隐藏数据结构”的地方。我认为这意味着模式。如果是这样,就我而言,无监督学习和监督学习之间有什么区别。他们两个都会在任何时候给我一个关于与那所房子有关的未来负荷的预测。

我的背景

我正在攻读 EE(电力系统)硕士学位。我也是机器学习的新手。

2个回答

我认为这是时间序列预测之一,因为您想使用过去的住宅负荷数据集按时间预测未来的住宅负荷。根据我的经验,我建议使用 LSTM RNN 作为解决方案。考虑到重要事件之间的未知大小和持续时间,LSTM 非常适合对时间序列进行分类、处理和预测。当然,这是有监督的学习。

至于您的案例中监督学习和无监督学习之间的区别,您不需要为此解决方案使用无监督学习,因为您已经拥有具有输入/正确输出的数据集。如果您正在为具有相应目标的每个输入训练您的机器学习任务,则称为监督学习,它可以在经过充分训练后为任何新输入提供目标。相反,如果您仅使用一组输入来训练您的机器学习任务,则称为无监督学习,它将能够找到不同输入之间的结构或关系。它说你应该使用监督学习——RNN 或 CNN。

PS:至于框架,我推荐使用 Tensorflow 或 Keras。

监督学习和无监督学习之间的区别在于,在监督学习中,我们有一个标记数据(具有正确的输出),即有一个因变量,而 ML 任务的工作是产生一个接近实际输出的输出。在无监督学习中,我们没有任何因变量,或者我们没有标记数据或实际输出,ML 任务的工作是找到隐藏模式并根据模式对数据进行分组。

您将使用哪种类型的 ML 算法在很大程度上取决于数据的类型,您可以通过可视化数据来找到这些算法。如果输入和输出之间存在线性相关性,您可以使用简单的线性回归,这就足够了,并且没有线性相关性比您可以使用 SVM'S,如果您不想使用它,您可以使用 hit 并尝试方法并应用所有简单的算法,如朴素贝叶斯、线性回归、SVM,并选择能给出最佳结果的算法。

关于 LSTM,它们是一种深度学习网络,主要用于时间序列数据和非常复杂的数据,例如音频数据或句子中的单词,这是该任务的过度复杂性。如果您想进行深度学习,则可以使用简单的人工神经网络来完成此任务