在没有交互项的模型中(即没有被构造为其他项的乘积的项),每个变量的回归系数是回归曲面在该变量方向上的斜率。无论变量的值如何,它都是恒定的,因此可以说是衡量该变量的整体效果。
在具有交互作用的模型中,这种解释可以在没有进一步限定的情况下仅针对那些不参与任何交互作用的变量进行。对于涉及交互作用的变量,“主效应”回归系数——即变量本身的回归系数——是当所有其他变量与与该变量交互的值为零,并且系数的显着性检验仅指预测变量空间的该区域中回归曲面的斜率。. 由于不要求在该空间区域中实际存在数据,因此主效应系数可能与实际观察到数据的预测空间区域中的回归曲面的斜率几乎没有相似之处。
在方差分析中,主效应系数类似于简单的主效应,而不是整体的主效应。此外,它可能指在 anova 设计中将是空单元格,其中数据是通过从具有数据的单元格外推而提供的。
对于类似于 anova 中的整体主效应并且不外推到观察数据的区域之外的变量整体效应的度量,我们必须查看回归表面在变量方向上的平均斜率,其中平均超过实际观察到的 N 个案例。该平均斜率可以表示为模型中涉及所讨论变量的所有项的回归系数的加权和。
重量很难描述,但很容易得到。变量的主效应系数的权重始终为 1。对于涉及该变量的项的每个其他系数,权重是该项中其他变量的乘积的平均值。例如,如果我们有五个“原始”变量x1, x2, x3, x4, x5
,加上四个双向交互(x1,x2), (x1,x3), (x2,x3), (x4,x5)
和一个三向交互(x1,x2,x3)
,那么模型是
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5 +
b12*x1*x2 + b13*x1*x3 + b23*x2*x3 + b45*x4*x5 +
b123*x1*x2*x3 + e
整体的主要影响是
B1 = b1 + b12*M[x2] + b13*M[x3] + b123*M[x2*x3],
B2 = b2 + b12*M[x1] + b23*M[x3] + b123*M[x1*x3],
B3 = b3 + b13*M[x1] + b23*M[x2] + b123*M[x1*x2],
B4 = b4 + b45*M[x5],
B5 = b5 + b45*M[x4],
其中 M[.] 表示括号内数量的样本均值。括号内的所有乘积项都是为了进行回归而构建的,因此回归程序应该已经知道它们并且应该能够根据要求打印它们的平均值。
在只有主效应和双向交互作用的模型中,有一种更简单的方法可以获得整体效应:将原始变量居中 [1] 以它们的平均值。这是在计算乘积项之前完成的,而不是对乘积完成的。然后所有的 M[.] 表达式将变为 0,回归系数将可以解释为整体效果。b的值会改变;B 的值不会。只有参与交互的变量需要居中,但将其他测量变量居中通常没有害处。使变量居中的一般效果是,除了更改截距外,它仅更改与居中变量相互作用的其他变量的系数。尤其,它不会改变任何涉及居中变量的项的系数。在上面给出的示例中,使 x1 居中会改变 b0、b2、b3 和 b23。
[1 - 不同的人使用“居中”的方式不同,足以引起混乱。如此处使用的,“以#为中心变量”意味着从变量的所有分数中减去#,将原始分数转换为与#的偏差。]
那么为什么不经常以手段为中心呢?三个原因。首先,未居中变量的主效应系数本身可能很重要。在这种情况下居中会适得其反,因为它会改变其他变量的主效应系数。
其次,居中将使所有 M[.] 表达式为 0,从而将简单效果转换为整体效果,仅在没有三向或更高交互作用的模型中。如果模型包含这样的交互,那么仍然必须完成 b -> B 计算,即使所有变量都以它们的平均值为中心。
第三,以平均值等值为中心,该值由预测变量的分布定义,而不是合理选择,这意味着受中心影响的所有系数都将特定于您的特定样本。如果你以平均值为中心,那么试图复制你的研究的人必须以你的平均值为中心,而不是他们自己的平均值,如果他们想要获得与你相同的系数。这个问题的解决方案是将每个变量集中在该变量的一个合理选择的中心值上,该中心值取决于分数的含义,而不取决于分数的分布。但是,b -> B 计算仍然是必要的。
总体效果的显着性可以通过测试回归系数线性组合的常用程序来测试。但是,必须谨慎解释结果,因为整体效果不是结构参数,而是取决于设计。结构参数——回归系数(未居中,或有合理居中)和误差方差——在预测变量分布的变化下可能会保持不变,但总体影响通常会发生变化。整体效果是特定于特定样本的,不应预期会延续到在预测变量上具有不同分布的其他样本。如果总体效果在一项研究中显着而在另一项研究中不显着,则它可能仅反映预测变量分布的差异。