流行病学和计量经济学模型如何以及为什么以不同方式处理多重共线性?

机器算法验证 回归 多重回归 计量经济学 多重共线性 流行病学
2022-04-20 03:52:20

线性多元回归模型的构建通常根据学科不同。在流行病学中,线性多元回归可能适合使用关于模型参数的假设来检验关联。建模策略通常旨在减少变量的数量,以仅包括需要控制的变量,即混杂变量和潜在的影响修饰符。同样,对于流行病学的预测,模型的简约性以及对共线性和多重共线性的关注将减少模型中的变量数量。通常,这些做法限制了共线性和多重共线性。在计量经济学线性多元回归模型中,经常使用很多变量来构建模型,其中共线性和多重共线性有时可以忽略不计。

似乎建模理念的差异允许根据每个学科使用多元回归分析。但是由于统计学在流行病学和计量经济学中都被大量使用,这两个领域使用的统计方法不应该在模型构建过程中需要相同的假设吗?

1个回答

“模型构建”过程是用词不当。根据学科的科学专业知识和样本的统计能力,执行良好的分析会预先指定要包含在最终模型中的变量及其编码。我们不能仅从统计输出中判断一个变量是“混杂因素”还是“对撞机”,它只是归结为专家之间的协议和对初始分析规范的承诺。

模型构建并不意味着我们像积木一样堆叠变量,直到我们建立了从数据到发布的桥梁。“共线性”和“简约”是抽象的概念,除了作为诊断之外,它们不考虑分析。当然,我们使用广泛的诊断来查看图表并了解各种变量的贡献。当“共线性”特指极端共线性时,即结果不收敛或不稳定时,需要一些先进的方法或其他补救措施;我认为无论您是经济学家还是流行病学家,所有公认的方法都是可行的。同样,即使调整变量与结果完全不显着相关,您也可以

经济学和流行病学有广泛的文献,这意味着有不好的例子,特别是技术讨论过于深入杂草而无法代表有意义的演示的例子。这更加复杂,因为好的文章通常对模型选择有一个非常紧凑的总结陈述。所有这些都使得很难在学科之间进行真正的正面比较。