机器算法验证 - DAG：没有后门路径，但背景信息表明需要调整 - 吾爱随笔录

DAG：没有后门路径，但背景信息表明需要调整

机器算法验证因果关系调解混杂达格因果图

2022-04-03 11:14:30

我对居住城镇对收入的影响感兴趣。

虽然 DAG 有很多箭头，但它的解释其实很简单：

我有 6 个协变量 (Cov1-6)，所有这些都导致中介场景，导致后门路径为零。
我还有 2 个未测量的可能重要的协变量 (U1-2)，它们也只有中介场景（没有后门路径）。

但是，我确实知道不同城镇的主题是不同的。根据其他证据和我的研究数据，我拥有的 6 个协变量存在差异。因此，这告诉我调整是必要的。

因此，在这种情况下应该使用后门标准。我应该使用析取原因标准（调整你所拥有的一切，直到你不打开任何新的后门路径）。但是，daggity包没有这样的选项。它只能选择使用 Judea Pearl 的单门标准。

问题：

析取原因准则和珀尔单门准则有什么区别？

如果我有上述背景知识，调整所有可用的六个协变量是否合理？

1个回答

析取原因准则和珀尔单门准则有什么区别？

单门标准建立了两个变量之间因果关系的条件，例如 $X \rightarrow Y$ , 将由回归系数一致估计 $X$ 在响应的多变量回归模型中 $Y$ . Breifly，它规定，对于包含它们之间的各种路径并且是非循环的（即，它是一个 DAG）的一组变量，那么这些变量的一个子集， $Z$ , 就足够了

$Z$ 不包含 $Y$ ，和
通过删除箭头 $X \rightarrow Y$ , $X$ 然后独立于 $Y$

这导致了我们应该以混杂因素（即后门调整）而不是中介为条件的熟悉的“规则”。

它还导致“前门调整”，我们能够估计 $X$ 上 $Y$ 在 $X \rightarrow M \rightarrow Y$ 即使存在无法测量的混杂因素。

Disjunctive Cause Criterion ( VanderWeele , 2019) 实际上与后门调整非常相似，但试图避免必须明确识别混杂因素，而是寻求调整主要暴露或结果（或两者兼而有之）的变量)，但不包括工具变量。但是，我说“尝试”，因为仍然需要包括混杂因素：

“控制作为暴露或结果或两者原因的每个协变量；从该集合中排除任何已知为工具变量的变量；并包括作为协变量的任何常见的未测量变量的代理暴露的原因和结果"

范德威勒 TJ。混杂因素选择的原则。Eur J 流行病学。2019. https://doi.org/10.1007/s10654-019-00494-6。

这种方法的问题是双重的。首先，它会导致“过度调整”，也就是说，与珀尔的理论不同，它不会导致“最小足够”的协变量集，因此一般不会导致模型简约，并且可以由于协变量之间的高度相关性而遭受问题。其次，它可能导致调解人的加入，范德维勒承认这将是一个问题。

如果我有上述背景知识，调整所有可用的六个协变量是否合理？

不，我认为这不合适。所有 6 个观察到的变量似乎都是TOWNon的因果效应的混杂因素INCOME，不应对其进行调整。这正是我在上一段中提到的这种技术的第二个问题的一个例子。如果您确实调整了调解员，请参阅此答案以获取详细信息和可能出现问题的示例：

DAG 如何帮助减少因果推理中的偏差？

如果没有您的研究问题、研究和数据的更多详细信息，很难提供进一步的建议，但您可能希望研究具有城镇随机效应的多级结构方程模型，尽管如果TOWN这是您的主要接触，这可能不会是路要走，但某种 SEM 可能值得一看。我建议问一个关于如何进一步进行的新问题。

其它你可能感兴趣的问题

上一篇对具有树间和树内变化的设计的分析下一篇关于指数随机变量最小值的维基百科证明