机器算法验证 - 逻辑回归中交互项的显着性和可信度区间 - 吾爱随笔录

逻辑回归中交互项的显着性和可信度区间

机器算法验证物流贝叶斯统计学意义相互作用

2022-04-11 02:36:44

我在 WinBugs 中拟合了贝叶斯逻辑回归，它有一个交互项。像这样：

P r o b (y_{i} = 1) = {l o g i t}^{- 1} (a + b_{1} * x_{i} + b_{2} * w_{i} + b_{3} * x_{i} * w_{i})

$\mathrm{Prob}(y_{i}=1) = \mathrm{logit}^{-1} (a + b_{1}*x_{i} + b_{2}*w_{i} + b_{3}*x_{i}*w_{i})$

其中是标准化连续变量，是虚拟变量。实际上模型更复杂，但我想让事情变得简单。 $x$ $w$

碰巧交互项是“显着的”，但不是单个预测变量。例如，

$\mathrm{mean}(b_{1}) = -.2$ 和分位数： -1.3和 $95%$ $(-1.3$ $.7)$

$\mathrm{mean}(b_{2}) = -.4$ 和分位数： -1.3和 $95%$ $(-1.3$ $.5)$

$\mathrm{mean}(b_{3}) = 1.4$ 和分位数：(.和 $95%$ $(.4$ $2.5)$

你们对如何应对这一发现有什么建议吗？我认为当的整体效果的 95% 可信区间。这将是：x 的总影响的 95% 分位数，以为条件：和 $x$ $w=1$ $w=1$ $(-1.3+.4$ $.7+2.5) = (-.9 + 3.2)$

这个对吗？如果没有，我该怎么办？关于该主题的任何参考资料？

3个回答

不，您的计算不正确，因为：

a)和在后验分布中可能是相关的，并且 $b_1$ $b_3$

b）即使他们不是，这也不是你计算它的方式（想想大数定律）。

但不要害怕，在 WinBUGS 中有一个非常简单的方法可以做到这一点。只需定义一个新变量：

b1b3 <- b1 + b3

并监控其值。

编辑：

为了更好地解释我的第一点，假设后验具有联合多元正态分布（在这种情况下不会，但它可以作为有用的说明）。然后参数具有分布，因此 95% 的可信区间为 - 请注意，这仅取决于均值和方差。 $b_i$ $N(\mu_i,\sigma_i^2)$ $(\mu_i - 1.96 \sigma_i,\mu_i + 1.96 \sigma_i)$

现在将有分布。请注意，方差项（以及因此 95% 可信区间）涉及相关项，无法从或的区间中找到。 $b_1+b_3$ $N(\mu_1 + \mu_3,\sigma_1^2 + 2 \rho_{13}\sigma_1\sigma_3 + \sigma_3^2)$ $\rho_{13}$ $b_1$ $b_3$

（我关于大数定律的观点是，两个独立随机变量之和的标准差小于标准差之和。）

至于如何在 WinBUGS 中实现，我的想法是这样的：

model {
  a ~ dXXXX
  b1 ~ dXXXX
  b2 ~ dXXXX
  b3 ~ dXXXX
  b1b3 <- b1 + b3

  for (i in 1:N) {
    logit(p[i]) <- a + b1*x[i] + b2*w[i] + b3*x[i]*w[i]
    y[i] ~ dbern(p[i])
  }
}

在采样器的每一步，节点b1b3将从b1和更新b3。它不需要先验，因为它只是其他两个节点的确定性函数。

一些想法：1）我不确定这是贝叶斯的事实是否重要。2）我认为你的方法是正确的 3）逻辑回归中的交互很棘手。我在一篇关于 SAS PROC LOGISTIC 的论文中写到了这一点，但总体思路是成立的。那篇论文在我的博客上，可以在这里找到

我目前有类似的问题。我也相信计算 w 的总效果的方法是正确的。我相信这可以通过

h0: b2 + b3 * 均值 (x) = 0; 哈：b2 + b3 * 平均值（x）！= 0

然而，我偶然发现了 Ai/Norton 的一篇论文，他声称“非线性模型中的相互作用效应的大小不等于相互作用项的边际效应，可以是相反的符号，并且其统计显着性不是由标准软件。” （2003 年，第 123 页）

所以也许你应该尝试应用他们的公式。（如果你明白怎么做，请告诉我。）

PS。这似乎类似于逻辑回归的 chow 测试。Alfred DeMaris (2004, p. 283) 对此进行了描述。

参考：

Ai, Chunrong / Norton, Edward (2003)：logit 和 probit 模型中的交互项，经济快报 80，p。123–129

DeMaris, Alfred (2004)：社会数据回归：连续和有限响应变量建模。John Wiley & Sons, Inc.，新泽西州霍博肯

其它你可能感兴趣的问题

上一篇少量观察的自举下一篇线性回归，异方差，怀特检验解释？