机器算法验证 - 我刚刚进行了 200 万次回归 - 综合似然 - 吾爱随笔录

我目前正在尝试实现一种方法，该方法在一篇名为“我刚刚进行了两百万次回归”的流行论文中使用。它背后的基本思想是，在某些情况下，模型中应该包含哪些控件并不明显。在这种情况下，您可以做的一件事是随机绘制控件，运行数百万个不同的回归，然后查看您感兴趣的变量如何反应。如果它在所有规范中通常具有相同的符号，那么我们可以认为它比符号总是变化的变量更健壮。

大部分论文都很清楚。但是，论文以下列方式对所有这些不同的回归进行加权：给定规范的综合似然除以所有规范的所有综合似然之和。

我遇到的麻烦是我不确定综合可能性与我想要运行的 OLS 回归（在 Stata 中）有何关系。在我不断遇到诸如混合效应逻辑回归之类的问题时，谷歌搜索诸如“stata 综合可能性”之类的主题一直是死胡同。我承认这些模型太复杂了，我无法掌握。

我目前的工作是，我确实（有点）理解的文献中使用了不同的加权方案。例如，可以根据似然比指数对每个回归进行加权。甚至还有一个使用 lri 作为权重的 R 包。当然，我也想实现原来的。

有什么建议吗？

论文链接： http ://down.cenet.org.cn/upfile/34/2009112141315178.pdf