我可以将“年份”的系数解释为我的预测变量未解释的年份之间的差异吗?

机器算法验证 r 多重回归 回归系数 样条 回归策略
2022-04-03 08:07:42

我正在对包含多年测量的自然实验进行统计分析。我有两个与物理相关的自变量Y

  1. 我对模型未解释的年份之间是否存在差异感兴趣。
  2. 我想测试第三个预测变量是否可以减少年份之间的差异。

我在线性回归中添加Year了分类预测器(我使用的是自然三次样条)。我的模型如下所示:

Linear Regression Model

 ols(formula = depend ~ rcs(X1, 3) + rcs(X2, 4) + Yearf, data = data,
     x = T, y = T)

                 Model Likelihood    Discrimination
                       Ratio Test           Indexes
 Obs     869    LR chi2    805.76    R2       0.604
 sigma0.6327    d.f.           10    R2 adj   0.600
 d.f.    858    Pr(> chi2) 0.0000    g        0.848

 Residuals

      Min       1Q   Median       3Q      Max
 -2.75550 -0.40733  0.01893  0.42597  1.70108


            Coef    S.E.   t      Pr(>|t|)
 Intercept   1.5327 0.2067   7.41 <0.0001
 X1          1.0437 0.0525  19.89 <0.0001
 X1'        -0.8147 0.0686 -11.88 <0.0001
 X2          1.2507 0.1670   7.49 <0.0001
 X2'        -2.4775 0.6915  -3.58 0.0004
 X2''        3.2983 1.2123   2.72 0.0066
 Yearf=2016  0.2475 0.0814   3.04 0.0024
 Yearf=2017  0.1620 0.0802   2.02 0.0437
 Yearf=2018  0.0440 0.0862   0.51 0.6096
 Yearf=2019 -0.5260 0.0829  -6.34 <0.0001
 Yearf=2020  0.1457 0.0813   1.79 0.0734

预测变量的效果图如下所示:

在此处输入图像描述

添加 X3 后,效果图如下所示:

在此处输入图像描述

关于我在本文开头提出的问题,我将结果解释如下,但我不确定整个方法是否有效:

  1. 如果X1,X2(并且X3在第二个图中)设置为它们的平均值,则每年 Y 的平均响应将是图中 的值Yearf

  2. X3从视觉上看,当添加到模型中时,年份之间的差异会减少,而平均响应的标准误差会增加。视觉上这样做是否有效?据我所知,ananova仅告诉我 x 年与我的基准年(此处为 2015 年)之间的差异是否显着,但我不想比较特定年份的差异。我想了解整个画面。你能理解这个吗?

1个回答

做得好。我觉得你的解释还可以。跑步anova()会给你一个比你描述的更普遍的时间趋势测试——测试时间趋势是否平坦,即任何一对年份之间存在差异的地方。检查差异也很有用R2由于yearf有无调整x3

如果您以更高的分辨率测量时间,分析会稍微好一些。然后你可以建模年份 + 年份的小数部分而不是整数年份。