我正在对包含多年测量的自然实验进行统计分析。我有两个与物理相关的自变量Y
。
- 我对模型未解释的年份之间是否存在差异感兴趣。
- 我想测试第三个预测变量是否可以减少年份之间的差异。
我在线性回归中添加Year
了分类预测器(我使用的是自然三次样条)。我的模型如下所示:
Linear Regression Model
ols(formula = depend ~ rcs(X1, 3) + rcs(X2, 4) + Yearf, data = data,
x = T, y = T)
Model Likelihood Discrimination
Ratio Test Indexes
Obs 869 LR chi2 805.76 R2 0.604
sigma0.6327 d.f. 10 R2 adj 0.600
d.f. 858 Pr(> chi2) 0.0000 g 0.848
Residuals
Min 1Q Median 3Q Max
-2.75550 -0.40733 0.01893 0.42597 1.70108
Coef S.E. t Pr(>|t|)
Intercept 1.5327 0.2067 7.41 <0.0001
X1 1.0437 0.0525 19.89 <0.0001
X1' -0.8147 0.0686 -11.88 <0.0001
X2 1.2507 0.1670 7.49 <0.0001
X2' -2.4775 0.6915 -3.58 0.0004
X2'' 3.2983 1.2123 2.72 0.0066
Yearf=2016 0.2475 0.0814 3.04 0.0024
Yearf=2017 0.1620 0.0802 2.02 0.0437
Yearf=2018 0.0440 0.0862 0.51 0.6096
Yearf=2019 -0.5260 0.0829 -6.34 <0.0001
Yearf=2020 0.1457 0.0813 1.79 0.0734
预测变量的效果图如下所示:
添加 X3 后,效果图如下所示:
关于我在本文开头提出的问题,我将结果解释如下,但我不确定整个方法是否有效:
如果
X1,X2
(并且X3
在第二个图中)设置为它们的平均值,则每年 Y 的平均响应将是图中 的值Yearf
。X3
从视觉上看,当添加到模型中时,年份之间的差异会减少,而平均响应的标准误差会增加。视觉上这样做是否有效?据我所知,ananova
仅告诉我 x 年与我的基准年(此处为 2015 年)之间的差异是否显着,但我不想比较特定年份的差异。我想了解整个画面。你能理解这个吗?