如何在回归中处理不同的重要变量,包括重叠信息?

机器算法验证 回归 因果关系 达格
2022-03-18 05:57:10

我对吸烟广告对吸烟率的影响感兴趣我在数据中还有两个分类混杂因素:townyear

可能的 DAG 显示了两个需要在调节中关闭的后门。每个城镇可能具有可能对广告(法律)或吸烟率(居住因素)产生影响的不同特征。

在此处输入图像描述

但是,我的数据有点棘手,因为它的详细程度有限。Smoking_ads 是按研究年份为每个城镇计算的:每个城镇的“Smoking_ads”值非常相似。例如,“C”镇的值介于 22-24 之间,而 D 镇的值介于 233-257 之间。

在此处输入图像描述

为了说明,一个愚蠢的类比是以下模型:

weight ~ sex + breast_size

1)我是否应该适应城镇?看来,等添加城镇会杀死效果。你如何处理这种情况?

2) 如果将“城镇”作为另一个级别添加到模型+(1 |城镇)中,会有什么不同?

1个回答
  1. 我是否应该适应城镇?看来,等添加城镇会杀死效果。你如何处理这种情况?

是的,您将希望将其包含town在您的模型中,因为根据 DAG,它是一个混杂因素。

  1. 如果将“城镇”作为另一个级别添加到模型+(1 |城镇)中,会有什么不同?

根据你的 DAG,它不仅是一个混杂因素,而且你还有重复的措施。如果你有足够的数量,随机截取是一个很好的方法。拟合固定效果也会达到同样的效果。您可能想在此处查看相关问题的答案: 随机效应如何针对模型中的混杂进行调整?