这是一些上下文。我有兴趣确定两个环境变量(温度、营养水平)在 11 年期间如何影响响应变量的平均值。每年都有来自超过 10 万个地点的数据。
目标是确定在 11 年期间,响应变量的平均值是否对环境变量的变化做出了响应(例如,温度升高 + 养分增加 = 响应更大)。
不幸的是,由于响应是平均值(不看平均值,只是定期的年际变化会淹没信号),回归将是 11 个数据点(每年 1 个平均值),有 2 个解释变量。对我来说,即使是线性正回归也很难被认为是有意义的,因为数据集是如此之小(甚至不满足标称的 40 点/变量,除非关系非常强)。
我做出这个假设是否正确?谁能提供我可能遗漏的任何其他想法/观点?
PS:一些警告:如果不等待更多年,就无法获得更多数据。因此,可用的数据是我们真正必须使用的数据。