Snijders & Bosker(第 8 章,第 8.2 节,第 119 页)在他们的书“多级分析:基本和高级多级建模简介”(1999 年)中说,截距-斜率相关性计算为截距-斜率协方差除以通过截距方差和斜率方差乘积的平方根,在 -1 和 +1 之间没有界限,甚至可以是无限的。
鉴于此,我认为我不应该相信它。但我有一个例子来说明。在我的一项分析中,种族(二分法),年龄和年龄*种族作为固定效应,队列作为随机效应,种族二分法变量作为随机斜率,我的一系列散点图显示斜率在值之间变化不大我的集群(即群组)变量,并且我没有看到跨群组的斜率变得更小或更陡峭。似然比检验还表明,尽管我的总样本量(N=22,156),随机截距和随机斜率模型之间的拟合并不显着。然而,截距-斜率相关性接近-0.80(这表明随着时间的推移,Y 变量的组差异有很强的收敛性,即跨群组)。
除了 Snijders & Bosker (1999) 已经说过的话,我认为这很好地说明了为什么我不相信截距-斜率相关性。
我们真的应该信任并报告多层次研究中的截距斜率相关性吗?具体来说,这种相关性有什么用处?
编辑1:我认为它不会回答我的问题,但gung要求我提供更多信息。如果有帮助,请参见下文。
数据来自综合社会调查。对于语法,我使用了 Stata 12,所以它是:
xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml cov(un) var
wordsum
是词汇测试分数(0-10),bw1
是种族变量(黑色=0,白色=1),aged1-aged9
是年龄的虚拟变量,bw1aged1-bw1aged9
是种族和年龄之间的相互作用,cohort21
是我的群组变量(21 个类别,编码为 0 到 20)。
输出内容如下:
. xtmixed wordsum bw1 aged1 aged2 aged3 aged4 aged6 aged7 aged8 aged9 bw1aged1 bw1aged2 bw1aged3 bw1aged4 bw1aged6 bw1aged7 bw1aged8 bw1aged9 || cohort21: bw1, reml
> cov(un) var
Performing EM optimization:
Performing gradient-based optimization:
Iteration 0: log restricted-likelihood = -46809.738
Iteration 1: log restricted-likelihood = -46809.673
Iteration 2: log restricted-likelihood = -46809.673
Computing standard errors:
Mixed-effects REML regression Number of obs = 22156
Group variable: cohort21 Number of groups = 21
Obs per group: min = 307
avg = 1055.0
max = 1728
Wald chi2(17) = 1563.31
Log restricted-likelihood = -46809.673 Prob > chi2 = 0.0000
------------------------------------------------------------------------------
wordsum | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
bw1 | 1.295614 .1030182 12.58 0.000 1.093702 1.497526
aged1 | -.7546665 .139246 -5.42 0.000 -1.027584 -.4817494
aged2 | -.3792977 .1315739 -2.88 0.004 -.6371779 -.1214175
aged3 | -.1504477 .1286839 -1.17 0.242 -.4026635 .101768
aged4 | -.1160748 .1339034 -0.87 0.386 -.3785207 .1463711
aged6 | -.1653243 .1365332 -1.21 0.226 -.4329245 .102276
aged7 | -.2355365 .143577 -1.64 0.101 -.5169423 .0458693
aged8 | -.2810572 .1575993 -1.78 0.075 -.5899461 .0278318
aged9 | -.6922531 .1690787 -4.09 0.000 -1.023641 -.3608649
bw1aged1 | -.2634496 .1506558 -1.75 0.080 -.5587297 .0318304
bw1aged2 | -.1059969 .1427813 -0.74 0.458 -.3858431 .1738493
bw1aged3 | -.1189573 .1410978 -0.84 0.399 -.395504 .1575893
bw1aged4 | .058361 .1457749 0.40 0.689 -.2273525 .3440746
bw1aged6 | .1909798 .1484818 1.29 0.198 -.1000393 .4819988
bw1aged7 | .2117798 .154987 1.37 0.172 -.0919891 .5155486
bw1aged8 | .3350124 .167292 2.00 0.045 .0071262 .6628987
bw1aged9 | .7307429 .1758304 4.16 0.000 .3861217 1.075364
_cons | 5.208518 .1060306 49.12 0.000 5.000702 5.416334
------------------------------------------------------------------------------
------------------------------------------------------------------------------
Random-effects Parameters | Estimate Std. Err. [95% Conf. Interval]
-----------------------------+------------------------------------------------
cohort21: Unstructured |
var(bw1) | .0049087 .010795 .0000659 .3655149
var(_cons) | .0480407 .0271812 .0158491 .145618
cov(bw1,_cons) | -.0119882 .015875 -.0431026 .0191262
-----------------------------+------------------------------------------------
var(Residual) | 3.988915 .0379483 3.915227 4.06399
------------------------------------------------------------------------------
LR test vs. linear regression: chi2(3) = 85.83 Prob > chi2 = 0.0000
Note: LR test is conservative and provided only for reference.
我制作的散点图如下所示。有九个散点图,一个用于我的年龄变量的每个类别。
编辑2:
. estat recovariance
Random-effects covariance matrix for level cohort21
| bw1 _cons
-------------+----------------------
bw1 | .0049087
_cons | -.0119882 .0480407
我还想补充一点:困扰我的是,关于截距-斜率协方差/相关性,Joop J. Hox (2010, p. 90) 在他的“多级分析技术和应用,第二版”一书中说:
如果将其表示为截距和斜率残差之间的相关性,则更容易解释此协方差。...在除时间变量外没有其他预测变量的模型中,这种相关性可以解释为普通相关性,但在模型 5 和 6 中,它是部分相关性,以模型中的预测变量为条件。
因此,似乎不是每个人都会同意 Snijders & Bosker (1999, p. 119) 的观点,他们认为“相关性的概念在这里没有意义”,因为它没有在 [-1, 1] 之间的界限。