我的理解是,即使回归也不能给出因果关系。它只能给出 y 变量和 x 变量之间的关联以及可能的方向。我对么?即使在大多数课程教科书和各种在线课程页面上,我也经常发现类似于“x 预测 y”的短语。您经常将回归变量称为预测变量,将 y 称为响应变量。
- 将它用于线性回归有多公平?
- 逻辑回归如何?(如果我确实有一个阈值 t 可以比较概率?)
我的理解是,即使回归也不能给出因果关系。它只能给出 y 变量和 x 变量之间的关联以及可能的方向。我对么?即使在大多数课程教科书和各种在线课程页面上,我也经常发现类似于“x 预测 y”的短语。您经常将回归变量称为预测变量,将 y 称为响应变量。
使用“预测”这个词没有问题。
重要的是要认识到预测与因果关系无关。考虑一个案例,大多数死于医院急诊室的人死于心脏病发作。如果你听说一个病人死了,但不知道原因,你可以预测它可能是心脏病发作,因为你知道心脏病发作占>50%。你在做一个预测,但你是从一个已知的结果预测一个未知的原因。此外,此示例中的预测是分类的,因此类似于逻辑回归。(类比可能比多项式逻辑回归更强,但这并不重要。)
对于它的价值,预测根本不必与任何直接的因果关系相关。只要关系可靠,您就可以根据虚假相关性进行预测。考虑根据双胞胎的兄弟姐妹预测同卵双胞胎的未知身高。在这种情况下,两个高度都是一组共同原因(共同的遗传和环境)的影响。双胞胎的身高不是对方的原因或结果。尽管如此,您可以在这种情况下做出非常好的预测。