机器算法验证 - 我如何向外行解释比例赔率模型？ - 吾爱随笔录 - 问答

我如何向外行解释比例赔率模型？

机器算法验证解释优势比赔率

2022-03-15 04:30:22

我正在写一篇跨学科研究论文，但在清楚地解释我的发现时遇到了一些麻烦。特别是，我应用了一个比例优势模型，其中包含一个回归量和三个截距（三个有序类别），其中。 $x$ $\alpha_{j}$ $j = 1|2, \,\,2|3,\,\, 3|4$

l o g i t (π_{j}) = l n (\frac{π_{j}}{1 - π_{j}}) = α_{j} + β^{T} x .

${logit}(\pi_{j}) = {ln}\left(\frac{\pi_{j}}{1 - \pi_{j}}\right) = \alpha_{j} + \beta^{T}x.$

对于估计的系数，我获得了大约 1.1 的优势比，这应该表明，随着回归量值的增加，从较低或等于较高类别移动的可能性增加了约 10%。 $\beta$

如您所见，我的解释不是很清楚，可能会引起不了解比例赔率模型和/或缺乏适当统计培训的读者的一些疑问。

你能帮我改一下措辞，让我的发现能够被更广泛的受众理解吗？

谢谢！

2个回答

我认为第一个也是最大的障碍是确保人们确实了解逻辑回归以及优势比实际上是什么。如果他们走得那么远，您只需要解释比例赔率模型将逻辑回归进一步解释有序的分类响应。

一种天真的方法可能是为切点运行逻辑回归模型。您可以削减结果，使正面响应为 3 或更高，而负面响应为 2 或更低。这是一种有效的数据分析方法，除了切点是任意的。在 2 而不是 3 处运行相同模型时，您可能会得到稍有不同的结果。

从某种意义上说，比例赔率模型对所有可能的切点模型进行“平均”，以最大限度地提高您可以从数据中获取的信息量。这对于建模一个或多个连续或分类预测变量与有序结果之间的关联非常有用，它甚至可以用于在某种程度上预测结果。

“现场”比例赔率的一个例子来自以下论文，作者检查了环境空气污染与哮喘严重程度之间的关系（在李克特类型量表上）

我们的结果表明，小于或等于 2.5 μm (PM2.5) 的颗粒物在 1 天后每增加 10 μg/m3 与更严重哮喘发作的几率增加 1.20 倍相关 [95% 置信区间 ( CI), 1.05 至 1.37]

这里的“更严重的哮喘发作”被认为是对比例优势模型所估计内容的外行解释。从本质上讲，它传达了对发现的非常好的反事实解释，这就是为什么我作为统计学家如此喜欢这些模型的原因。

一个关键步骤是确保人们理解为什么对数赔率是有用的。为了帮助激发 log-odds-ratio，请尝试以下两个原则的故事：

高中 A 将辍学率从 10% 降低到 5%，大幅下降了 50%！
高中 B 将毕业率从 90% 提高到 95%，增幅为 5.5%。

纽约时报称赞第一任校长将辍学率降低了一半。另一位校长在当地报纸上得到了简短的提及。尽管他们做了同样的事情。

对数优势比将这些放在偶数条件下：

\log (\frac{0.95 / 0.05}{0.90 / 0.10}) = 0.32

$\log \left( \frac{0.95/0.05}{0.90/0.10}\right)=0.32$ 和

\log (\frac{0.05 / 0.95}{0.10 / 0.90}) = - 0.32

$\log \left( \frac{0.05/0.95}{0.10/0.90}\right)=-0.32$

简而言之，您可以说对数赔率比率认为从 10% 到 5% 的变化等同于从 90% 到 95% 的变化。

其它你可能感兴趣的问题

上一篇结构方程模型 (SEM) 只是验证性因子分析 (CFA) 的另一个名称吗？下一篇这个图表在横轴上显示艺术家的图标，表示使用的唯一词的数量，该怎样称呼这个图表？