手动更改符号估计

机器算法验证 估计 回归系数
2022-03-26 08:06:23

经过验证的读者,

如果基础理论支持,是否允许手动更改估计的符号(通过 OLS 获得)?

我的第一个想法是,这基本上是一种操纵,它迫使估计朝着我们想要的方向发展;实际上,估计的符号应该直接捕捉到效果的“正确”方向。但是,我开始认为在某些情况下它可能是合理的。

我的情况如下。我的假设是协变量 X 对 Y 有负面影响,但是 X 由代理 X1 表示(最终包含在模型中;X 没有出现在回归中)。所以,这就像说 X 是 X1 的函数。X1 可以对 X 产生负面影响或正面影响。因此,当 X1 对 X 的影响也是负的,但当 X1 对 X 的影响为正时,它是正的。在后一种情况下,我可以在 B1 前面放一个 - 并以我现在的方式(但更正式)证明其合理性吗?


我应该纠正自己。我们没有改变系数的符号,但是我们改变了这个变量的观测值的符号。我们有实验数据,我们使用劳动力市场需求方的竞争代理(我们的利益变量);我们从以往的文献中知道,竞争对因变量有负面影响。我们使用的 2 个代理与 Y 负相关,因此也与竞争有关(代理价值下降,竞争增加,Y 减少)。我们使用的第三个代理是速率,而是朝着相同的竞争方向移动(速率增加,竞争增加),因此它对 Y 有积极影响,这使它成为一个不好的代理。所以,我想我们可以用这个变量的反面来代表竞争,这样我们就可以保持代理和因变量之间的负相关关系。这个比率的反面(我的意思是:1-rate)是一个真正有意义的衡量标准。

2个回答

如果您愿意,您也可以将每个系数设为您的生日,但您不能真正将结果称为基于统计的东西,而且它肯定不是 OLS。你也无法测试它。

您提出的问题并不能证明将系数设为 LS 估计值的负数。

1)首先让我们知道这个参数是正数:

如果某物的价值存在先验限制,则将它们构建到估计中-但是(对于简单的回归,正如您似乎正在讨论的那样)您将得到零或几乎为零的参数估计,而不是β^.

2)现在,“有一个代理”:

如果“X1 可以对 X 产生负面或正面影响”,那么它并没有真正起到代理的作用听起来像是调解人或主持人;至少是一个协变量——不是代理,你的模型中需要两者。(此外,这句话似乎具有倒退的效果;对于 X1 的系数来说,如果 X1 不存在,X1 的系数会出现“错误的符号”,那么 X 不需要影响 X1 吗?)

其次,你不能只是说“如果情况如此,它可以改变符号”然后改变符号,好像假设是真的一样。这里实际上有两个独立的谬误!

a) 你没有给出任何理由来保留估计的大小。即使某些东西正在使星座发生变化,除了一些非常有限的情况(你会做其他事情的情况!),它也不会以同样的幅度离开。

b) “如果条件A是真的,结果B会发生”本身并不意味着这种情况A是真的这看起来像是无知论证的谬误,再加上后果的谬误论证——看起来你在说——“我们不知道 A 没有发生,我们不喜欢结果我们得到了,所以我们假设 A 发生是为了得到预期的结果”)

对于你想申请的那种论证是有效的,你必须证明你认为可能已经发生的事情的所有部分都确实发生了可能有许多替代解释——在这种情况下,理论可能是错误的。数据可能很糟糕。可能还有其他重要但不存在的变量。还有其他事情可能发生了。你需要证明那些没有发生。

即使你可以证明你认为发生的所有事情都发生了,即使你可以排除批评者可能提出的所有替代合理解释,人们仍然会说“你到底为什么要使用代理你现在可以肯定会给出错误的信号吗?”

您还必须证明这种效应具有正确的幅度,可以证明只需将结果乘以 -1 而不是 -0.1 或 -7.8 或其他数字。这将是一项艰巨的任务。

除了@glen_b 的出色答案之外,我能看到做你正在做的事情的唯一远程合理的理由是,如果你知道,不知何故,X1 与 X 完全负相关。这种情况可能发生的一种方式是,如果 X 是一个差异两个值之间,X1 是反向差。

但是,即使是这种情况,最好将 X1 乘以 -1 并得到 X,而且您一开始就不需要代理。

因此,简而言之,如果您要在运行回归后操纵系数,则最好不要首先运行回归。