交互术语解释

机器算法验证 自习 分类数据 相互作用 解释 回归系数
2022-03-06 01:16:02

我有一个模型: 是虚拟变量。

ln(earnings)=a+b1female+b2white+b3female×white
femalewhite

我已经解释了b1b2

  • b1 = 鉴于您不是白人,女性收入与男性相比的变化
  • b2 = 鉴于您是男性,白人收入与非白人相比的变化

但我无法解释交互项的系数()。请帮我解决一下这个。b3

让我更清楚地说明我需要从这个回归中得到什么 现在我知道 b1 存在性别薪酬差异,我也知道 b2 存在种族薪酬差异。现在有了 b3,我需要知道他们的性别薪酬差距仅适用于白人。我怎么能通过上面的回归和没有测试来解决这个问题。

ln(earnings)=2.618656.0899657female+.382019white.2754126female×white

1个回答

b3之和之间的差异即白人女性与非白人男性之和之差加上非白人女性与非白人男性之差加上白人男性与非白人男性之差。 老实说,这样解释有点乱。更典型的是,我们解释测试a+b1+b2

b3=x¯white female[  x¯non-white male  +(x¯non-white femalex¯non-white male)+(x¯white malex¯non-white male) ]

b3作为对影响的可加性的测试。(方括号的相加效应。)然后我们只对简单效应(即,一个因素在预先指定的其他因素的水平)。人们很少尝试孤立地解释相互作用效应/系数。 whitefemale[]whitefemale

它还可以帮助您在这里阅读我的答案:Interpretation of betas when there are multiple categorical variables,它涵盖了一个类似但更简单的没有交互的情况。