我目前正在尝试实现一种方法,该方法在一篇名为“我刚刚进行了两百万次回归”的流行论文中使用。它背后的基本思想是,在某些情况下,模型中应该包含哪些控件并不明显。在这种情况下,您可以做的一件事是随机绘制控件,运行数百万个不同的回归,然后查看您感兴趣的变量如何反应。如果它在所有规范中通常具有相同的符号,那么我们可以认为它比符号总是变化的变量更健壮。
大部分论文都很清楚。但是,论文以下列方式对所有这些不同的回归进行加权:给定规范的综合似然除以所有规范的所有综合似然之和。
我遇到的麻烦是我不确定综合可能性与我想要运行的 OLS 回归(在 Stata 中)有何关系。在我不断遇到诸如混合效应逻辑回归之类的问题时,谷歌搜索诸如“stata 综合可能性”之类的主题一直是死胡同。我承认这些模型太复杂了,我无法掌握。
我目前的工作是,我确实(有点)理解的文献中使用了不同的加权方案。例如,可以根据似然比指数对每个回归进行加权。甚至还有一个使用 lri 作为权重的 R 包。当然,我也想实现原来的。
有什么建议吗?
论文链接: http ://down.cenet.org.cn/upfile/34/2009112141315178.pdf