如果我们只对建模而不是预测感兴趣,那么正则化会有所帮助吗?

机器算法验证 交叉验证 计量经济学 模型选择 解释 正则化
2022-01-26 08:21:19

如果我们只对估计(和解释)模型参数感兴趣,而不是预测或预测,那么正则化会有所帮助吗?

如果您的目标是对新数据做出良好的预测,我看到正则化/交叉验证非常有用。但是,如果您从事的是传统经济学,而您所关心的只是估算呢?β? 交叉验证在这种情况下也有用吗?我在概念上遇到的困难是我们实际上可以计算L(Y,Y^)在测试数据上,但我们永远无法计算L(β,β^)因为真实β根据定义,从未观察到。(假设假设甚至存在一个真实的β,即我们知道生成数据的模型系列。)

假设你的损失是L(β,β^)=ββ^. 您面临偏差-方差权衡,对吗?所以,理论上,你最好做一些正则化。但是你怎么可能选择你的正则化参数呢?

我很高兴看到一个线性回归模型的简单数值示例,其系数为β(β1,β2,,βk),其中研究人员的损失函数为ββ^,甚至只是(β1β^1)2在实践中,如何使用交叉验证来改善这些示例中的预期损失?


编辑:DJohnson 将我指向与此问题相关的https://www.cs.cornell.edu/home/kleinber/aer15-prediction.pdf 。作者写道

机器学习技术......提供了一种严格的方法来预测 Y^,它(i)使用数据本身来决定如何进行偏差 - 方差权衡,并且(ii)允许搜索非常丰富的集合变量和函数形式。但是一切都是有代价的:必须始终牢记,因为它们针对Y^进行了调整,所以它们 不会(没有许多其他假设)为β^提供非常有用的保证。

另一篇相关论文,再次感谢 DJohnson: http ://arxiv.org/pdf/1504.01132v3.pdf 。本文解决了我在上面遇到的问题:

将机器学习方法(例如现成的回归树)应用于因果推理问题的一个基本挑战是,基于交叉验证的正则化方法通常依赖于观察“基本事实”,即实际结果在交叉验证样本中。然而,如果我们的目标是最小化处理效果的均方误差,我们会遇到 [11] 所说的“因果推理的基本问题”:没有观察到任何单个单元的因果效应,因此我们不直接有一个基本事实。我们通过提出构建治疗因果效应的均方误差的无偏估计的方法来解决这个问题。

2个回答

是的,当我们想要有偏的低方差估计时。我特别喜欢gung在这里的帖子收缩方法解决了什么问题?请允许我把gung的图贴在这里...

在此处输入图像描述 如果您检查制作的情节,您将清楚为什么我们需要正则化/收缩。起初,我感到奇怪,为什么我们需要有偏估计?但是看着那个图,我意识到,低方差模型有很多优点:例如,它在生产使用中更“稳定”。

如果我们只对建模(即估计参数)而不对预测感兴趣,那么交叉验证会有所帮助吗?

是的,它可以。例如,前几天我通过决策树使用参数重要性估计。每次构建树时,我都会检查交叉验证错误。我尽量减少误差,然后我将进入下一步估计参数的重要性。如果您构建的第一棵树非常糟糕并且您没有检查错误,那么您可能会得到不太准确(如果没有错误)的答案。

我认为主要原因是每种技术都有许多控制变量。即使一个控制变量的微小变化也会提供不同的结果。

检查交叉验证错误后如何改进模型?好吧,这取决于您的型号。希望在尝试几次之后,您会对最重要的控制变量有所了解,并可以操纵它们以找到较低的错误。