逻辑回归中交互项的显着性和可信度区间

机器算法验证 物流 贝叶斯 统计学意义 相互作用
2022-04-11 02:36:44

我在 WinBugs 中拟合了贝叶斯逻辑回归,它有一个交互项。像这样:

Prob(yi=1)=logit1(a+b1xi+b2wi+b3xiwi)

其中是标准化连续变量,是虚拟变量。实际上模型更复杂,但我想让事情变得简单。xw

碰巧交互项是“显着的”,但不是单个预测变量。例如,

mean(b1)=.2分位数: -1.3和95(1.3.7)

mean(b2)=.4分位数: -1.3和95(1.3.5)

mean(b3)=1.4分位数:(.95(.42.5)

你们对如何应对这一发现有什么建议吗?我认为的整体效果的 95% 可信区间。这将是:x 的总影响的 95% 分位数,以为条件:xw=1w=1(1.3+.4.7+2.5)=(.9+3.2)

这个对吗?如果没有,我该怎么办?关于该主题的任何参考资料?

3个回答

不,您的计算不正确,因为:

a)在后验分布中可能是相关的,并且b1b3

b)即使他们不是,这也不是你计算它的方式(想想大数定律)。

但不要害怕,在 WinBUGS 中有一个非常简单的方法可以做到这一点。只需定义一个新变量:

b1b3 <- b1 + b3

并监控其值。

编辑:

为了更好地解释我的第一点,假设后验具有联合多元正态分布(在这种情况下不会,但它可以作为有用的说明)。然后参数具有分布,因此 95% 的可信区间为 - 请注意,这仅取决于均值和方差。biN(μi,σi2)(μi1.96σi,μi+1.96σi)

现在将有分布请注意,方差项(以及因此 95% 可信区间)涉及相关项,无法从的区间中找到。b1+b3N(μ1+μ3,σ12+2ρ13σ1σ3+σ32)ρ13b1b3

(我关于大数定律的观点是,两个独立随机变量之和的标准差小于标准差之和。)

至于如何在 WinBUGS 中实现,我的想法是这样的:

model {
  a ~ dXXXX
  b1 ~ dXXXX
  b2 ~ dXXXX
  b3 ~ dXXXX
  b1b3 <- b1 + b3

  for (i in 1:N) {
    logit(p[i]) <- a + b1*x[i] + b2*w[i] + b3*x[i]*w[i]
    y[i] ~ dbern(p[i])
  }
}

在采样器的每一步,节点b1b3将从b1和更新b3它不需要先验,因为它只是其他两个节点的确定性函数。

一些想法:1)我不确定这是贝叶斯的事实是否重要。2)我认为你的方法是正确的 3)逻辑回归中的交互很棘手。我在一篇关于 SAS PROC LOGISTIC 的论文中写到了这一点,但总体思路是成立的。那篇论文在我的博客上,可以在这里找到

我目前有类似的问题。我也相信计算 w 的总效果的方法是正确的。我相信这可以通过

h0: b2 + b3 * 均值 (x) = 0; 哈:b2 + b3 * 平均值(x)!= 0

然而,我偶然发现了 Ai/Norton 的一篇论文,他声称“非线性模型中的相互作用效应的大小不等于相互作用项的边际效应,可以是相反的符号,并且其统计显着性不是由标准软件。” (2003 年,第 123 页)

所以也许你应该尝试应用他们的公式。(如果你明白怎么做,请告诉我。)

PS。这似乎类似于逻辑回归的 chow 测试。Alfred DeMaris (2004, p. 283) 对此进行了描述。

参考:

Ai, Chunrong / Norton, Edward (2003):logit 和 probit 模型中的交互项,经济快报 80,p。123–129

DeMaris, Alfred (2004):社会数据回归:连续和有限响应变量建模。John Wiley & Sons, Inc.,新泽西州霍博肯