在回归分析中使用差异分数作为自变量是否有效

机器算法验证 回归 造型 变化分数
2022-03-18 11:31:53

我想看看从基线到两年后随访的 BPD 症状数量的差异是否可以预测 2 年随访时的心理社会功能。所以我想做一个线性回归,使用差异分数(BPD 分数 T1-BPD 分数 T2)作为 IV,将 T2 的不同功能度量作为 DV(例如 SOFAS 分数作为全局功能;同伴评分量表作为人际功能;和一些二元度量,例如在 T2 工作或不工作;因此需要完成一系列回归)。

使用差异分数是否有效。我已经阅读了很多关于使用差异分数作为因变量的信息,但不确定相同的信息是否对应于使用差异分数作为 IV?

我想还有一个问题是使用结果变量的 T1 测量作为回归方程中的协变量来测量该变量的变化是否更合适?或者这是一个单独的问题?

我很欣赏任何评论,因为我不确定如何继续进行,并且正在围绕如何最好地获得一些清晰度。

3个回答

作为自变量的差异分数很好,但它们对方程施加了一种功能上更具限制性的形式。考虑;

y=β11(X2)β21(X1)+e1

对等式;

y=β12(ΔX)+e2

在哪里ΔX=X2X1. 你可以看到第二个方程是第一个方程的特例,当β11=β21. 只有当您有充分的理由相信功能更严格的形式是合理的时,您才应该使用更改分数。

您实际上可能会遇到以下情况β11β21具有抵消作用(例如β11=β21,而实际上这两个单独的组件对结果有贡献时,变化分数似乎无关紧要。

据我所知,没有理由不能在回归中使用差异分数作为自变量。它不违反任何假设。

你的第二个问题更复杂。您经常使用 T1 度量作为协变量的想法。人们有时也将差异分数用作 DV(您可能从阅读中知道)。

当变量被错误地测量时(因为所有心理变量都不可避免地),事前测试存在一些问题。如果我没记错的话,Collins 和 Horn中有详细信息。

在多元回归中使用差异分数作为预测变量通常会导致模型拟合的一些损失,即如果您将差异分数中的两个变量都保留为具有自己斜率的预测变量,则 R 平方将小于可能的值. 也就是说,如果您有这样的模型:

y=a+b1d,where   d=(x1x2)
这与强制两个斜率大小相等但符号相反的效果相同。那就是通过乘法,
y=a+b1(x1x2)
y=a+b1x1b1x2.

因此,从某种意义上说,它强制您使用 +1 和1系数,或至少相等但符号斜率相反。

为了最大化模型的拟合度,请改用这种方法,允许自由估计两个变量的斜率(如果它们恰好相等但符号相反,那么差异分数是可以的):

y=a+b1x1+b2x2
R平方或模型拟合的损失取决于自由估计的斜率与差异分数的线性限制的差异程度。运行具有不同总体斜率的模拟,我们发现 R 平方的损失(DV 中的可预测方差)范围从零到大约 0.83,因此它可能很小或很大。

底线 - 只需使用带有两个变量的常规模型,它们有自己的估计斜率作为上面的最后一个模型。如果最佳拟合结果来自 time1 - time2(差异分数),那么它将被估计为这样,如果不是,那么您的模型拟合会好得多。

参考资料

小爱德华兹 (2001)。十个不同分数的神话。组织研究方法,4, 264-286。下载

线性回归中的差异分数:具有相关预测变量的模型拟合 mhelford@roosevelt.edu 与非差异分数模型相比,当使用具有相关预测变量的差异分数时,使用统计模拟来估计线性回归中模型拟合的损失。在 9 个模拟人群中,模型拟合的差异范围为 0 到 0.84。