如何从回归输出评估效果大小
也许一个例子会有所帮助。这个非常简单的例子来自 Gelman 和 Hill (2006, p.31-34)。我们想根据母亲的教育 (mom.hs) 和智商 (mom.iq) 来预测孩子的认知测试分数 (kid.score): mom.hs 是一个二元预测因子,指示母亲是否高中毕业 (1) 或不是 (0),并且 mom.iq 是一个连续预测器。拟合的线性回归模型是
现在,解释相当简单。例如,对于 mom.iq 增加 1 个单位,我预计 child.score 增加 0.6 分(保持 mom.hs 的值不变)。这种关系(kid.score 和 mom.iq 之间)在统计上是显着的,但实际上是否显着?效果大小,这里是非标准化回归系数(0.6),大吗?其实,我不知道。我需要了解因变量和自变量的值的分布。但更重要的是,我需要了解解释儿童认知测试分数与母亲智商之间关系的理论。
查看表格并假设这是一个线性模型(并且报告了非标准化回归系数),对于“第 1 组(1998 年治疗)学校的指标”增加 1 个单位,我预计因变量减少 0.25 个点(对于模型1 并保持其他变量不变)。同样,我需要知道解释变量之间关系的理论,这将指导我解释影响的大小。
在这种情况下,我想不出一个基准。但是,如果拥有基准的一个功能是使比较成为可能,那么标准化系数可能值得考虑。标准化(测试版,) 系数更容易比较,因为变量被标准化为平均值为 0,标准差为 1。您可以比较 beta 系数(以标准差为单位)来评估预测变量的相对强度,例如“一个标准X 中的偏差增加/减少将产生Y 的标准差增加/减少”。Acock (2014) 还认为,它们可以被解释为类似于相关性:被认为是弱者, 适中,和强烈影响(第 272 页),但我无法从其他来源验证此信息。此外,我对标准化系数的使用提出了一些(强烈的)警告(Fox,2016,p.102;Harrell,2015,p.103-104),这就是例子。
因此,再次重复,要评估效果的大小(基于此输出,非标准化回归系数),您需要了解有关变量的信息(例如,它们的测量方式、分布、值范围等) ,以及解释它们之间关系的理论。
阿科克,AC(2014)。Stata 简介(第 4 版)。得克萨斯州:Stata Press。
福克斯,J. (2016)。应用回归分析和广义线性模型(第 3 版)。洛杉矶:圣人出版社。
Gelman, A. 和 Hill, J. (2006)。使用回归和多级模型的数据分析。剑桥:剑桥大学出版社。
哈勒尔,FE(2015)。回归建模策略(第 2 版)。查姆:斯普林格。
