在多元回归中使用差异分数作为预测变量通常会导致模型拟合的一些损失,即如果您将差异分数中的两个变量都保留为具有自己斜率的预测变量,则 R 平方将小于可能的值. 也就是说,如果您有这样的模型:
y′=a+b1d,where d=(x1−x2)
这与强制两个斜率大小相等但符号相反的效果相同。那就是通过乘法,
y′=a+b1(x1−x2)
和y′=a+b1x1−b1x2.
因此,从某种意义上说,它强制您使用 +1 和−1系数,或至少相等但符号斜率相反。
为了最大化模型的拟合度,请改用这种方法,允许自由估计两个变量的斜率(如果它们恰好相等但符号相反,那么差异分数是可以的):
y′=a+b1x1+b2x2
R平方或模型拟合的损失取决于自由估计的斜率与差异分数的线性限制的差异程度。运行具有不同总体斜率的模拟,我们发现 R 平方的损失(DV 中的可预测方差)范围从零到大约 0.83,因此它可能很小或很大。
底线 - 只需使用带有两个变量的常规模型,它们有自己的估计斜率作为上面的最后一个模型。如果最佳拟合结果来自 time1 - time2(差异分数),那么它将被估计为这样,如果不是,那么您的模型拟合会好得多。
参考资料:
小爱德华兹 (2001)。十个不同分数的神话。组织研究方法,4, 264-286。下载
线性回归中的差异分数:具有相关预测变量的模型拟合 mhelford@roosevelt.edu 与非差异分数模型相比,当使用具有相关预测变量的差异分数时,使用统计模拟来估计线性回归中模型拟合的损失。在 9 个模拟人群中,模型拟合的差异范围为 0 到 0.84。