机器算法验证 - 因果效应实施的双重稳健估计 - 吾爱随笔录

机器算法验证回归

2022-03-13 11:58:16

有谁知道双重稳健估计方法的实现（除了 SAS 宏）：

Funk, MJ, Westreich, D. 等人 (2011)。因果效应的双重稳健估计。美国流行病学杂志，173 (7): 761-767。[DOI] ?

4个回答

双鲁棒估计实际上并不是很难用您选择的语言来实现。您实际上所做的只是以两种方式控制变量，而不是一种方式——只要用于控制的两个模型之一是正确的，您就成功地控制了混杂。

在我看来，最简单的方法是使用逆处理概率 (IPTW) 权重来加权数据集，然后在正常回归模型中包含变量。这就是作者在上面链接的论文中处理问题的方式。还有其他选项，通常基于用于匹配或作为模型中的协变量的倾向得分。

无论您喜欢什么统计语言，都有很多关于 IPTW 的介绍。我会提供代码片段，但我的所有内容都在 SAS 中，并且读起来可能与作者非常相似。

简而言之，您所做的是使用逻辑回归之类的方法根据协变量对暴露概率进行建模，并根据该模型估计预测的暴露概率。这会给你一个倾向得分。顾名思义，治疗权重的逆概率是 1/倾向得分。这有时会产生极值，因此有些人通过将暴露的边际概率（通过结果的逻辑回归模型和无协变量获得）替换上述等式中的 1 来稳定权重。

现在，您不再将分析中的每个主题视为 1 个主题，而是将它们视为主题的 n 个副本，其中 n 是它们的权重。如果您使用这些权重并包括协变量来运行回归模型，则会得出一个双重稳健的估计。

然而，请注意：虽然双重（或三重等）稳健估计为您提供了更多机会来指定正确的协变量模型，但它并不能保证您会这样做。更重要的是，不能让你免于无法衡量的混乱。

看起来甚至在您引用的文章发表之前，Stata 中就有一个实现：http: //www.stata-journal.com/article.html ?article=st0149 。

tmle R 包实现了基于目标最小损失的估计器，该估计器在条件下具有双重鲁棒性和高效性。它的另一个优点是它是一个替代估计器，而不是增强 IPTW（我假设你指的是那个）。

我有 Funk 等人中描述的估计器。2011（增强逆概率权重），在类zEpid内的 Python 3 库中实现AIPTW。详细信息和语法在这里。该库还包括 TMLE，以防您想同时使用这两种方法

其它你可能感兴趣的问题