我刚刚进行了 200 万次回归 - 综合似然

机器算法验证 似然比
2022-03-28 07:20:15

我目前正在尝试实现一种方法,该方法在一篇名为“我刚刚进行了两百万次回归”的流行论文中使用。它背后的基本思想是,在某些情况下,模型中应该包含哪些控件并不明显。在这种情况下,您可以做的一件事是随机绘制控件,运行数百万个不同的回归,然后查看您感兴趣的变量如何反应。如果它在所有规范中通常具有相同的符号,那么我们可以认为它比符号总是变化的变量更健壮。

大部分论文都很清楚。但是,论文以下列方式对所有这些不同的回归进行加权:给定规范的综合似然除以所有规范的所有综合似然之和。

我遇到的麻烦是我不确定综合可能性与我想要运行的 OLS 回归(在 Stata 中)有何关系。在我不断遇到诸如混合效应逻辑回归之类的问题时,谷歌搜索诸如“stata 综合可能性”之类的主题一直是死胡同。我承认这些模型太复杂了,我无法掌握。

我目前的工作是,我确实(有点)理解的文献中使用了不同的加权方案。例如,可以根据似然比指数对每个回归进行加权。甚至还有一个使用 lri 作为权重的 R 包。当然,我也想实现原来的。

有什么建议吗?

论文链接: http ://down.cenet.org.cn/upfile/34/2009112141315178.pdf

1个回答

对于 OLS,您仍然可以计算似然函数(指数对数似然,正如 Christoph Hanck 在评论中提到的那样)。这只是美好的旧时光Li=i(2πσ2).5exp(.5(yixiβ)2). Stata 将其存储为e(ll)运行回归后使用regress

然后你将权重构建为wi=LijLj.

最后,您使用以下方法构建回归系数的加权平均值wi作为权重。