回归模型中的左侧和右侧命名法

机器算法验证 回归 术语
2022-03-19 08:03:13

yi=β0+β1x1i+ε0i

描述回归模型的语言,例如上面指定的非常简单的线性回归,经常会发生变化,并且这种变化通常会带来细微的含义变化。例如,方程左边的模型部分可以被称为(其中我不知道的)括号中的内涵和外延:

  • 因变量(暗示因果关系)
  • 预测变量(暗示模型预测/做出预测)
  • 响应变量(暗示因果关系,或至少是时间顺序)
  • 结果变量(暗示因果关系)

等式右边的命名法的变化也是正确的(同样的免责声明,我对其他术语一无所知):

  • 自变量(暗示因果优先级,暗示实验设计)
  • 预测变量(暗示预测,暗示该变量具有与其关联的非零参数估计)

在提出审查或交流研究的过程中,我有机会不仅被要求使用一个或另一个术语,而且随后被要求使用我选择替换它的术语。虽然打电话的人当然是迂腐的(注意:我是一个专业的迂腐,所以我很同情),因为我们当然都理解所传达的内容,我仍然想知道:

回归模型中的左手和右手变量是否存在常用术语,这些术语与 (a) 模型的外部用途、(b) 变量之间的因果关系和 (c) 研究的各个方面无关用于自己产生变量的设计?

NB:我不是在询问正确建模和正确解释的重要问题(即我非常关心因果关系、研究设计等),而是对一般谈论此类模型的语言更感兴趣。

(我意识到“左手变量”和“右手变量”可能,我想,被解释为一个可信的答案,但这些术语似乎很笨拙......也许这是一个笨拙的问题。:)

1个回答

这是一个很好的问题。实际上,它太好了,以至于没有答案。据我所知,没有真正的“不可知论”术语来描述 Y。

根据我的经验和阅读,我发现语义是特定于领域的,也是特定于模型目标的。

计量经济学家在构建解释性模型时将使用因变量项。当他们构建一个更关注准确估计/预测而不是理论解释能力的预测模型时,他们可能会使用术语预测或拟合或估计变量。

大数据/深度学习人群使用完全不同的语言。而且,他们通常会使用术语响应变量或目标变量。他们的模型是如此的黑匣子,以至于他们通常不会试图解释一种现象,而是预测它并准确估计它。但是,不知何故,他们不会被使用“预测”一词抓住。他们更喜欢术语“响应”或“目标”。

我对结果变量这个术语不太熟悉。它可能在我接触较少的其他领域很普遍,例如社会科学,包括心理学、医学、临床试验、流行病学。

鉴于上述情况,我无法为您提供任何“不可知论”的语义来描述 Y。相反,我提供了一些关于在迎合不同受众时使用什么语义并反映模型目标的信息。总而言之,如果您与计量经济学家谈论因变量,而与深度学习类型谈论响应或目标变量,我认为没有人会受到伤害。希望您可以将这些人群分开,否则您可能会进行口头上的食物大战。