代理变量与工具变量

机器算法验证 回归 工具变量
2022-03-25 18:54:04

很短的问题。建立回归模型时,工具变量和代理变量之间究竟有什么区别?

2个回答

工具变量用于帮助估计因果效应(或减轻测量误差)工具变量必须影响感兴趣的自变量,并且只能通过感兴趣的自变量影响因变量。第二部分(仅通过自变量影响因变量)称为排除限制。

代理变量是您使用的变量,因为您认为它与您真正感兴趣的变量相关,但没有(或较差)测量。

考虑工具变量在做什么的一种方法是说你首先在工具 Z 上回归 X。然后你得到的是 X 的预测值——比如 X*。所以直观地说,这是你从 Z 得到的 X 的一部分。然后你取 Y 并在那些 X* 上回归它(并纠正标准错误)。这与决定直接使用 Z 作为代理并在 Z 上回归 Y 不同。直觉上,您将所有 Z 都包含在回归中,而不是 Z 与 X 的关系。