如何找到时间序列中的自变量与单个因变量之间的关系

计算科学 机器学习
2021-12-01 05:35:35

我有一个季节性作物在环境条件(降雨、湿度、温度等)下的作物产量数据集。几年的日常环境条件与每个季节的作物产量一起记录。

例子:

日期 , 温度 , 湿度 , 降雨

1/31/2019 , 28 , 64.55 , 1.2

2/1/2019 , 28.2 , 65.81 , 1.2

2/2/2019 , 28 , 67.18 , 0.6

2/3/2019 , 28 , 68.54 , 0.4

2/4/2019 , 27.43 , 69.17 , 0.2

上述季节的作物产量为37000公斤。

你能指导我如何找到作物产量(依赖)和每个环境因素(独立)之间的关系吗?我试图找出每个因素对一个季节作物产量的影响,但我很难弄清楚如何找到时间序列(环境因素)和单个变量(作物产量)之间的相关性。

2个回答

您是否尝试过使用最小二乘线性回归方法对不同形式的方程拟合数据?这将有助于消除方程的形式?如果您对此有疑问,我可以从我目前正在从“工程数学 - KA Stroud”中学习的一本书中分享一些很好的例子

您正试图找到多个时间序列与单个变量之间的相关性。现在,一个关键点是,由于不同环境条件的影响,这个单一变量会随着时间的推移而受到影响。因此,条件时间序列的影响是另一个时间序列,也许是每日作物产量。可以将单个变量视为这个隐藏时间序列的积分或总和。

估计未知序列的方法有很多种,目前还不清楚哪种方法合适,因为您只知道序列的总和。隐藏马尔可夫模型和过滤方法(如 3d-var)是可以尝试的,但可能会有更好的方法。