我有一个数据集,其中包含一个农场 10 年(2005 - 2014 年)的温度、降水和大豆产量数据。我想根据这些数据预测 2015 年的产量。
请注意,该数据集具有温度和降水的 DAILY 值,但每年只有 1 个产量值,因为作物收获发生在作物生长季节结束时。
我想建立一个回归或其他基于机器学习的模型来预测 2015 年的产量,基于回归/其他一些模型,该模型是通过研究前几年的产量与温度和降水之间的关系得出的。
我熟悉使用 scikit-learn 执行机器学习。但是,不确定如何表示这个问题。这里的棘手部分是每天都有温度和降水,但每年的产量只有 1 个值。
我该如何处理?